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内 容 简 介 


本 书 是 2011 年 出 版 的 (算法 与 数据 结构 (第 二 版 )) 的 修订 版 。 在 保持 原 书 基 本 框架 和 特色 的 基础 上 ， 
增加 了 常用 算法 设计 技术 。 全 书 系统 地 介绍 了 算法 与 数据 结构 方面 的 基本 知识 ,重点 阐述 了 基本 数据 结 
构 及 算法 在 程序 开发 中 的 应 用 方法 ,能 够 帮助 读者 极 大 地 提高 软件 开发 和 设计 能 力 。 本 书 主要 内 容 有 : 数 
据 结 构 和 算法 的 基本 概念 和 术语 ; 线性 表 、 树 和 图 的 逻辑 结构 ,存储 结构 及 应 用 实例 ,包括 栈 与 队列 、 数 组 
字符 串 等 特殊 线性 表 ; 查找 与 排序 操作 的 常用 算法 ; 蛮 力 算法 、 分 治 算法 、 动 态 规划 算法 、 贪 心算 法 、 回 
溯 算 法 及 分 枝 限 界 算法 等 常用 算法 设计 技术 。 本 书 给 出 的 所 有 算法 和 程序 都 采用 C 语言 描述 并 调试 通 
,部 分 算法 还 增加 了 C++ 实现 代码 。 本 书 注重 可 读 性 和 适用 性 , 书 中 附 有 大 量 的 图 表 、 程 序 ,使 读者 能 正 


\ 直 观 地 理解 问题 , 既 便 于 教学 ,又 便于 自学 。 


本 书 只 要 求 读者 具有 C 语言 基础 ,不 要 求 具 有 面向 对 象 程序 设计 基础 。 本 书 特别 适合 普通 高 校本 专 


科学 生 使 用 ,也 可 作为 其 他 程序 类 课程 的 辅导 教材 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防伪 标签 ,无 标签 者 不 得 销售 。 
版 权 所 有 ,侵权 必 究 。 侵 权 举 报 电话 : 010-62782989 13701121933 
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随 着 我 国 改革 开放 的 进一步 深化 ,高 等 教育 也 得 到 了 快速 发 展 , 各 地 高 校 紧密 结合 地 方 
经 济 建设 发 展 需 要 ,科学 运用 市 场 调节 机 制 ,加 大 了 使 用 信息 科学 等 现代 科学 技术 提升 、 改 
造 传 统 学 科 专 业 的 投入 力度 ,通过 教育 改革 合理 调整 和 配置 了 教育 资源 ,优化 了 传统 学 科 专 
业 , 积 极为 地 方 经 济 建设 输送 人 才 , 为 我 国 经 济 社会 的 快速 ,健康 和 可 持续 发 展 以 及 高 等 教 
育 自身 的 改革 发 展 做 出 了 巨大 贡献 。 但 是 ,高 等 教育 质量 还 需要 进一步 提高 以 适应 经 济 社 
会 发 展 的 需要 ,不 少 高 校 的 专业 设置 和 结构 不 尽 合理 ,教师 队伍 整体 素质 或 待 提高 ,人 才 培 
养 模式 .教学 内 容 和 方法 需要 进一步 转变 ,学 生 的 实践 能 力 和 创新 精神 吸 待 加 强 。 

教育 部 一 直 十 分 重视 高 等 教育 质量 工作 。2007 年 1 月 ,教育 部 下 发 了 《关于 实施 高 等 
学 校本 科教 学 质量 与 教学 改革 工程 的 意见 ,计划 实施 “高 等 学 校本 科教 学 质量 与 教学 改革 
工程 "(简称 “质量 工程 ”) ,通过 专业 结构 调整 .课程 教材 建设 、 实 践 教学 改革 教学 团队 建设 
等 多 项 内 容 , 进 一 步 深 化 高 等 学 校 教学 改革 ,提高 人 才 培 养 的 能 力 和 水 平 ,更 好 地 满足 经 济 
社会 发 展 对 高 素质 人 才 的 需要 。 在 贯彻 和 落实 教育 部 “质量 工程 的 过 程 中 ,各 地 高 校 发 挥 
师资 力量 强 、 办 学 经 验 丰富 .教学 资源 充裕 等 优势 ,对 其 特色 专业 及 特色 课程 ( 群 ) 加 以 规划 、 
整理 和 总 结 , 更 新 教学 内 容 改革 课程 体系 ,建设 了 一 大 批 内 容 新 .体系 新 ,方法 新 .手段 新 的 
特色 课程 。 在 此 基础 上 ,经 教育 部 相关 教学 指导 委员 会 专家 的 指导 和 建议 ,清华 大 学 出 版 社 
在 多 个 领域 精 选 各 高 校 的 特色 课程 ,分 别 规划 出 版 系列 教材 ,以 配合 “质量 工程 ”的 实施 , 满 
足 各 高 校 教学 质量 和 教学 改革 的 需要 。 

为 了 深入 贯彻 落实 教育 部 (关于 加 强 高 等 学 校本 科教 学 工作 ,提高 教学 质量 的 若干 意 
见 ) 精 神 , 紧 密 配合 教育 部 已 经 启动 的 “高 等 学 校 教学 质量 与 教学 改革 工程 精品 课程 建设 工 
作 ”, 在 有 关 专 家 、 教 授 的 倡议 和 有 关 部 门 的 大 力 支持 下 ,我 们 组 织 并 成 立 了 “清华 大 学 出 版 
社 教材 编审 委员 会 "(以 下 简称 “ 编 委 会 ”) , 旨 在 配合 教育 部 制定 精品 课程 教材 的 出 版 规划 ， 
讨论 并 实施 精品 课程 教材 的 编写 与 出 版 工作 。“ 编 委 会 "成员 皆 来 自 全 国 各 类 高 等 学 校 教学 
与 科研 第 一 线 的 骨干 教师 ,其 中 许多 教师 为 各 校 相关 院 、 系 主管 教学 的 院 长 或 系 主任 。 

按照 教育 部 的 要 求 ,“ 编 委 会 ”一 致 认为 .精品 课程 的 建设 工作 从 开始 就 要 坚持 高 标准 、 
严 要 求 , 处 于 一 个 比较 高 的 起 点 上 。 精 品 课程 教材 应 该 能 够 反映 各 高 校 教学 改革 与 课程 建 
设 的 需要 ,要 有 特色 风格 有 创新 性 (新 体系 、 新 内 容 、 新 手段 .新 思路 ,教材 的 内 容 体 系 有 和 较 
高 的 科学 创新 ,技术 创新 和 理念 创新 的 含量 ) 先进 性 (对 原 有 的 学 科 体系 有 实质 性 的 改革 和 
发 展 , 顺 应 并 符合 21 世纪 教学 发 展 的 规律 ,代表 并 引领 课程 发 展 的 趋势 和 方向 ) .示范 性 ( 教 
材 所 体现 的 课程 体系 具有 较 广泛 的 辐射 性 和 示范 性 ) 和 一 定 的 前 上 脆性。 教材 由 个 人 申报 或 
各 校 推荐 (通过 所 在 高 校 的 “ 编 委 会 ?成 员 推荐 ) ,经 “ 编 委 会 ”认真 评审 ,最 后 由 清华 大 学 出 版 
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社 审定 出 版 。 


目前 ,针对 计算 机 类 和 电子 信息 类 相关 专业 成 立 了 两 个 “ 编 委 会 ”, 即 “清华 大 学 出 版 社 
计算 机 教材 编审 委员 会 ”和 ”清华 大 学 出 版 社 电子 信息 教材 编审 委员 会 *。 推 出 的 特色 精品 


教材 包括 : 
(1) 21 世纪 高 等 学 校规 划 教材 。 
专业 的 计算 机 应 用 类 教材 。 


(2) 21 世纪 高 等 学 校规 划 教材 。 


教材 。 
(3) 21 世纪 高 等 学 校规 划 教材 。 
(4) 21 世纪 高 等 学 校规 划 教材 。 
(5) 21 世纪 高 等 学 校规 划 教材 。 


(6) 21 世纪 高 等 学 校规 划 教材 。 
(7) 21 世纪 高 等 学 校规 划 教材 。 
(8) 21 世纪 高 等 学 校规 划 教材 。 


计算 机 应 用 一 一 高 等 学 校 各 类 专业 ,特别 是 非 计算 机 


计算 机 科学 与 技术 一 一 高 等 学 校 计算 机 相关 专业 的 


电子 信息 一 一 高 等 学 校 电子 信息 相关 专业 的 教材 。 
软件 工程 一 一 高 等 学 校 软件 工程 相关 专业 的 教材 。 
信息 管理 与 信息 系统 。 

财经 管理 与 应 用 。 

电子 商务 。 

物 联 网 。 


清华 大 学 出 版 社 经 过 三 十 多 年 的 努力 ,在 教材 尤其 是 计算 机 和 电子 信息 类 专业 教材 出 
版 方面 树立 了 权威 品牌 ,为 我 国 的 高 等 教育 事业 做 出 了 重要 贡献 。 清 华 版 教材 形成 了 技术 
准确 、 内 容 严 谨 的 独特 风格 ,这 种 风格 将 延续 并 反映 在 特色 精品 教材 的 建设 中 。 


清华 大 学 出 版 社 教材 编审 委员 会 
联系 人 : 魏 江 江 


E-mail: weijj@tup. tsinghua. edu. cn 


1. 关于 算法 与 数据 结构 

随 着 计算 机 技术 的 日 益 发 展 ,其 应 用 早已 不 再 局 限于 简单 的 数值 运算 ,而 涉及 问题 的 分 
析 、 数 据 结构 框架 的 设计 以 及 插 和 人、 删除 ,排序 ,查找 等 复杂 的 非 数 值 处 理 和 操作 。 学 习 算 法 
与 数据 结构 就 是 为 以 后 利用 计算 机 高 效 地 开发 非 数 值 处 理 的 计算 机 程序 打下 坚实 的 理论 、 
方法 和 技术 基础 。 

算法 与 数据 结构 旨 在 分 析 、 研 究 计 算 机 加 工 的 数据 对 象 的 特性 ,以便 选择 适当 的 数据 结 
构 和 存储 结构 ,从 而 使 建立 在 其 上 的 解决 问题 的 算法 达到 最 优 。 

随 着 计算 机 技术 的 发 展 ,特别 是 大 数据 及 人 工 智能 技术 的 发 展 与 应 用 ,算法 的 重要 性 有 
目 共 睹 。《 算 法 与 数据 结构 (第 三 版 )》 是 对 2011 年 出 版 的 第 二 版 的 修订 。 本 版 教材 在 保持 
原 书 基本 框架 和 特色 的 基础 上 ,增加 了 蛮 力 算法 \ 分 治 算法 、 贪 心算 法 回潮 算 法 及 分 枝 限 界 
算法 思想 及 应 用 实例 。 

2. 结构 安排 

全 书 共 分 为 10 章 , 各 章 主 要 内 容 如 下 。 

第 1 章 : 绪论 。 主 要 介绍 数据 结构 和 算法 的 基本 概念 和 术语 、C 语言 的 数据 类 型 及 用 C 
语言 描述 算法 的 要 点 .C++ 语言 的 类 与 抽象 数据 类 型 的 关系 .C++ 语言 特性 及 与 C 语言 程序 
的 区 别 .Cr+ 语 言 验证 算法 的 方法 。 

第 2 章 : 线性 表 。 主 要 介绍 线性 表 的 人 逻辑 结构 ,线性 表 的 顺序 存储 结构 和 链 式 存储 结 
构 ,线性 表 的 应 用 实例 。 

第 3 章 : 栈 和 队列 。 主 要 介绍 栈 和 队列 的 基本 概念 及 存储 结构 、 栈 和 队列 的 应 用 实例 、 
递归 的 概念 及 设计 方法 、 递 归 实 现 与 栈 的 关系 。 

第 4 音 : 数组 和 字符 串 。 主 要 介绍 数组 存储 结构 及 应 用 实例 、 字 符 串 的 基本 概念 和 存 
储 结构 .字符 串 的 应 用 实例 。 

第 5 章 : 树 。 主 要 介绍 树 和 二 叉 树 的 基本 概念 及 存储 结构 .二 又 树 的 应 用 一 一 哈 夫 曼 
树 及 编码 。 

第 6 章 : 图 。 主 要 介绍 图 的 基本 概念 及 存储 结构 .图 的 遍历 、 图 的 生成 树 和 最 小 代价 生 
成 树 、 有 向 无 环 图 、 最 短路 径 、 图 的 应 用 实例 。 

第 7 章 : 查找 。 主 要 介绍 静态 查找 表 、 动 态 查找 表 、 喻 希 表 查找 。 

第 8 章 : 排序 。 主 要 介绍 插入 排序 交换 排 序 、 选 择 排序 、 归 并 排序 、 基 数 排序 、 外 部 
排序 。 

第 9 章 : 常用 算法 设计 技术 。 主 要 介绍 蛮 力 算法 ,分 治 算法 、 贪 心算 法 ,回溯 算法 及 分 
枝 限界 算法 的 思想 及 应 用 技巧 。 

第 10 章 : 标准 模板 库 。 简 单 介 绍 标准 模板 库 的 组 成 及 使 用 要 点 ,同时 介绍 STL 的 应 
用 实例 。 
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本 书 第 1.6、9 章 由 陈 媛 教授 编写 ,第 2、5 章 由 何 波 副教授 编写 ,第 3、4 章 由 卢 玲 副教授 
编写 ,第 7.8、10 章 由 刘 恒 洋 副 教授 编写 。 全 书 由 陈 媛 教授 统 稿 。 

带 * 的 内 容 为 可 选 内 容 , 不 必要 求 讲解 。 

3. 本 书 特点 

本 书 给 出 的 所 有 算法 和 程序 都 采用 C 语言 描述 并 调试 通过 ,部 分 算法 还 增加 了 C++ 实 
现代 码 , 用 C 和 C++ 两 种 语言 描述 算法 和 数据 结构 ,使 数据 结构 的 学 习 与 随后 的 程序 设计 
课程 紧密 结合 。 本 书 注重 可 读 性 和 实用 性 , 书 中 附 有 大 量 的 图 表 、 程 序 ,使 读者 能 正确 .直观 
地 理解 问题 ; 书 中 每 章 都 有 学 习 要 点 .习题 和 上 机 练习 , 既 便于 教学 ,又 便于 自学 。 

本 书 内 容 和 结构 体现 了 教学 改革 成 果 。 全 书 由 重庆 市 精品 课程 “数据 结构 ”重庆 理工 大 
学 课程 组 的 教师 编写 完成 。 作 者 都 是 长 期 在 高 校 从 事 “ 算 法 与 数据 结构 ”教学 的 一 线 教师 ， 
有 丰富 的 教学 经 验 和 软件 开发 能 力 。 作 者 从 多 年 的 教学 经 验 和 多 项 教研 课题 的 研究 成 果 
中 ,构建 了 数据 结构 概念 建立 和 编程 思想 培养 的 框架 体系 ,总 结 提炼 了 学 习 本 课程 的 重 难点 
和 解决 方法 ,大 部 分 样 例 都 经 过 整理 和 组 织 ,以 便 读 者 更 好 地 理解 掌握 。 同 时 ,本 书 获 * 重 庆 
理工 大 学 教材 建设 基金 资助 ”。 

4. 适用 对 象 

本 书 只 要 求 读者 具有 C 语言 基础 ,不 要 求 具有 面向 对 象 程序 设计 基础 ,通过 本 书 的 学 
习 可 帮助 读者 树立 面向 对 象 的 编程 思想 。 本 书 可 作为 计算 机 专业 、 信 息 管理 专业 及 其 他 相 
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本 章 学 习 要 点 

(1) 熟悉 各 名 词 和 术语 的 含义 ; 掌握 各 种 基本 概念 ,特别 是 数据 的 逻辑 结构 和 存储 结 
构 及 其 相互 关系 ; 熟悉 逻辑 结构 的 4 种 基本 类 型 ; 熟悉 存储 结构 的 两 种 基本 机 内 表示 方法 。 

(2) 了 解数 据 结 构 ,数据 类 型 .抽象 数据 类 型 的 区 别 和 联系 。 

(3) 了 解 算法 的 5 个 要 素 , 初 步 掌 握 估算 算法 时 间 复 杂 度 的 方法 。 

(4) 熟悉 C 语言 的 书写 规范 ,特别 要 注意 参数 传递 问题 ,能 够 灵活 运用 各 种 数据 类 型 来 
描述 问题 的 对 象 。 

(5) 理解 C++ 语言 的 类 和 抽象 数据 类 型 的 关系 ,理解 C++ 语言 验证 算法 的 方法 。 了 解 
C++ 语言 与 C 语言 程序 的 区 别 。 

计算 机 科学 是 一 门 研究 信息 的 表示 和 处 理 的 科学 ,而 信息 的 表示 和 组 织 又 直接 关系 到 
信息 处 理 程 序 的 效率 。 由 于 许多 程序 的 规模 大 、 结 构 复 杂 、 处 理 对 象 多 为 非 数 值 型 的 数据 ， 
因此 单纯 依靠 程序 设计 人 员 的 经 验 和 技巧 已 不 能 编写 出 高 效率 的 处 理 程序 。 为 了 设计 出 效 
率 高 .可 靠 性 强 的 程序 ,人 们 必须 对 程序 设计 的 方法 进行 系统 的 研究 。 这 就 要 求 程序 设计 人 
员 不 但 要 掌握 一 般 的 程序 设计 技巧 ,而 且 要 研究 计算 机 程序 加 工 的 对 象 , 即 研究 数据 的 特性 
以 及 数据 之 间 存 在 的 关系 ,这 就 是 数据 (或 称 信息 ) 结 构 。 

数据 结构 是 在 整个 计算 机 科学 与 技术 领域 上 广泛 被 使 用 的 术语 , 它 用 来 反映 一 个 数据 
的 内 部 构成 , 即 一 个 数据 由 哪些 成 分 数据 构成 .以 什么 方式 构成 . 呈 什 么 结构 (或 关系 )。 数 
据 结构 分 为 逻辑 上 的 数据 结构 和 物理 上 的 数据 结构 。 逻 辑 上 的 数据 结构 反映 成 分 数据 之 间 
的 逻辑 关系 ,而 物理 上 的 数据 结构 反映 成 分 数据 在 计算 机 内 部 的 存储 安排 。 


(Li 数据 结构 的 基本 概念 与 学 习 方法 


1.1.1 数据 结构 的 研究 对 象 


数据 结构 作为 一 门 学 科 ,主要 研究 数据 的 各 种 逻辑 结构 和 存储 结构 以 及 对 数据 的 各 种 
操作 。 它 主要 有 3 方面 的 内 容 : 数据 的 逻辑 结构 数据 的 物理 存储 结构 .对 数据 的 操作 (或 
算法 ,运算 )。 通 常 ,算法 的 设计 取决 于 数据 的 逻辑 结构 ,算法 的 实现 取决 于 数据 的 物理 存储 
结构 。 

用 计算 机 解决 一 个 实际 问题 时 ,一 般 的 步骤 是 : 首先 得 到 实际 问题 的 数学 模型 ,然后 设 
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计 相 应 的 算法 ,最 后 编写 ,调试 .完善 程序 ,直至 得 到 问题 的 答案 。 当 人 们 用 计算 机 处 理 数值 
计算 问题 时 ,所 用 的 数学 模型 是 用 数学 方程 描述 的 。 若 问题 是 不 变 的 ,要 用 代数 方程 描述 ; 
若 问题 是 动态 的 ,就 要 用 微分 方程 来 描述 。 所 涉及 的 运算 对 象 一 般 是 简单 的 整 型 、 实 型 和 逻 
辑 型 数据 ,因此 程序 设计 者 的 主要 精力 集中 于 程序 设计 技巧 上 ,而 不 是 数据 的 存储 和 组 织 
上 。 然 而 ,目前 计算 机 应 用 的 更 多 领域 是 * 非 数值 计算 问题 ”它们 的 数学 模型 无 法 用 数学 方 
程 描述 ,而 是 用 “数据 结构 ”描述 ,解决 此 类 问题 的 关键 是 设计 出 合适 的 数据 结构 。 这 是 一 种 
什么 样 的 数学 模型 呢 ? 下 面 用 3 个 例子 对 它们 进行 说 明 , 让 读者 对 这 种 模型 有 一 个 感性 的 
认识 。 

例 1.1 求 一 组 (x 个) 整数 中 的 最 大 值 。 

算法 : 基本 操作 是 “比较 两 个 数 的 大 小 ”。 

模型 : 由 多 个 整数 排 成 的 一 个 序列 (一 对 一 关系 ) 一 一 线性 结构 。 

例 1.2 计算 机 对 弈 。 

算法 : 对 弈 的 规则 和 策略 。 

模型 : 由 多 个 格局 构成 的 呈现 层次 结构 的 树 (一 对 多 关系 ) 一 一 树 形 结构 。 

例 1.3 制订 教学 计划 。 

算法 : 教学 计划 的 制订 规则 和 各 课程 间 的 先后 关系 。 

模型 : 各 课程 构成 的 复杂 的 先后 关系 (多 对 多 关系 ) 一 一 图 形 结构 。 

从 以 上 3 个 例子 可 以 看 出 ,描述 非 数值 计算 问题 的 数学 模型 是 用 线性 表 、 树 、 图 等 结构 
来 描述 的 ,这 也 就 是 “数据 结构 ”课程 的 研究 对 象 。 

一 般 地 说 ,数据 结构 是 一 门 研究 非 数值 计算 领域 的 程序 设计 问题 中 计算 机 的 操作 对 象 
以 及 它们 之 间 的 关系 和 操作 等 的 学 科 。 


1.1.2 数据 结构 的 基本 概念 和 基本 术语 
1. 数据 


数据 (Data) 是 所 有 能 被 输入 到 计算 机 中 , 且 被 计算 机 处 理 的 符号 的 集合 。 它 是 计算 机 
程序 加 工 、 处 理 的 对 象 。 客 观 事物 包括 数值 字符 、 声 音 、 图 形 、 图 像 等 ,它们 本 身 并 不 是 数 
据 , 只 有 通过 编码 转换 成 能 被 计算 机 识别 .存储 和 处 理 的 符号 形式 后 才 是 数据 。 例 如 , 例 1. 1 
中 的 一 批 整 型 数据 。 


2. 数据 元 素 


数据 元 素 (data element) 是 数据 的 基本 单位 ,在 计算 机 程序 中 通常 是 作为 一 个 整体 进行 
考虑 和 处 理 的 。 例 如 , 例 1.1 中 的 一 个 整 型 数据 。 


3. 数据 项 


数据 元 素 是 数据 结构 中 讨论 的 最 小 单位 。 若 数据 元 素 可 再 分 , 则 每 一 个 独立 的 处 理 单 
元 就 是 数据 项 (data item) ,数据 元 素 是 数据 项 的 集合 ; 若 数据 元 素 不 可 再 分 , 则 数据 元 素 和 
数据 项 是 同一 个 概念 。 例 如 , 例 1. 1 中 的 整 型 数据 不 可 再 分 ,一 个 整 型 数据 既是 数据 元 素 也 
是 数据 项 。 但 例 1. 3 中 的 课程 (包括 课程 号 .课程 名 等 ) 这 个 数据 元 素 可 再 分 ,课程 号 .课程 


名 就 是 数据 项 ,而 不 是 数据 元 素 了 。 
4. 数据 结构 


数据 结构 (data structure) 是 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 素 的 集合 。 这 
个 概念 涉及 了 两 个 内 容 : 一 个 是 数据 元 素 ; 另 一 个 是 数据 元 素 之 间 的 相互 关系 。 数 据 元 素 
不 是 孤立 存在 的 ,在 它们 之 间 总 是 存在 某 种 相互 关系 。 

5. 逻辑 结构 

逻辑 结构 (logic structure) 是 数据 元 素 之 间 的 相互 逻辑 关系 , 它 与 数据 的 存储 无 关 , 是 
独立 于 计算 机 的 。 

从 集合 论 的 观点 出 发 ,数据 结构 是 由 两 个 集合 构成 的 一 个 二 元 组 

B=(D,R) ,中 

B 是 一 种 数据 结构 , 它 由 同属 一 个 数据 对 象 的 数据 元 素 的 有 限 集 合 D 和 上 二 元 关 

系 的 有 限 集合 R 组 成 。 式 (1.1) 称 为 数据 结构 的 形式 定义 。 其 中 : 
及 二 《二 芝 主 二 区 机 
R={r; |1<j<m,m 宇 1} 

di 表示 第 i 个 数据 元 素 ,n 为 B 中 数据 元 素 的 个 数 ; r; 表示 第 j 个 关系 ,m 为 D 上 关 
系 的 个 数 。 一 般 讨论 m= 二 1 的 情况 , 即 R 中 只 包含 一 个 关系 ,R= {r})。 

D 上 的 二 元 关系 + 是 序 偶 的 集合 。 对 于 7 中 的 任 一 序 偶 <z,y >(r+,yED), 将 xz 称 为 
序 偶 的 第 一 元 素 ,将 y 称 为 序 偶 的 第 二 元 素 , 又 称 序 偶 的 第 一 元 素 为 第 二 元 素 的 前 驱 , 第 二 
元 素 为 第 一 元 素 的 后 继 。 例 如 , 序 偶 <z,y > 中 ,zx 为 y 的 前 驱 , 而 > 为 zx 的 后 继 。 

数据 结构 还 可 以 利用 图 形 形 象 地 表示 出 来 。 图 形 中 的 每 一 个 结 点 (或 称 为 顶点 ) 对 应 一 
个 数据 元 素 ,两 个 结 点 之 间 带 箭头 的 连 线 对 应 二 元 关系 中 的 一 个 序 偶 ,该 连 线 称 为 弧 或 有 向 
边 , 序 偶 的 第 一 元 素 称 为 弧 的 起 始 结 点 ( 弧 尾 ) ,第 二 元 素 称 为 弧 的 终止 结 点 ( 弧 头 ) 。 

例 1.4 一 例 1.6 根据 表 1. 1 构造 了 一 些 典 型 的 数据 结构 。 

表 1.1 教务 处 人 事 简 表 


职工 号 姓名 出 生年 份 职务 
1 王 敏 1962 处 长 
多 赵 华 1968 科 长 
3 刘 永 年 1964 科 长 
4 陈 曙光 1972 主任 
5 马力 仁 1959 科 员 
6 邢 德 1975 科 员 
7 高 为 1972 科 员 
8 张力 1967 科 员 


例 1.4 一 种 数据 结构 工 一 CD .R), 其 中 
三 三，23 8 
R={r} 
dy RO ee DA :4 a Ey Da DR th 
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对 应 的 图 形 如 图 1.1 所 示 。 


1.1 线性 结构 


不 难看 出 ,r 是 按 职工 年 龄 从 大 到 小 排列 的 关系 。 
在 工 中 ,每 一 个 数据 元 素 有 且 只 有 一 个 前 驱 元 素 ( 除 第 一 个 结 点 5 外 ), 有 且 只 有 一 个 
后 续 元 素 ( 除 最 后 一 个 元 素 6 外 ) 。 这 种 数据 结构 的 特点 是 数据 元 素 之 间 的 1 : 1 联系。 一 
般 地 ,把 具有 这 种 特点 的 数据 结构 称 为 线性 结构 。 
例 1.5 一 种 数据 结构 T= 二 (D,R), 其 中 
D={1,2,3,4,5,6,7,8} 


R={r} 
r={(1 2 13) (1 4 (275) 26)5(3,7) 35038)) 
对 应 的 图 形 如 图 1. 2 所 示 。 个 


不 难看 出 ,~ 是 人 员 之 间 的 领导 和 被 领导 的 关系 。 

在 TT 中 ,每 一 个 数据 元 素 有 且 只 有 一 个 前 驱 元 素 ( 除 根 结 点 1 @) G) (4) 
外 ) ,但 可 以 有 任意 多 个 后 续 元 素 ( 树 叶 具 有 0 个 后 续 结 点 )。 这 种 
数据 结构 的 特点 是 数据 元 素 之 间 的 1 : N 联系 。 一 般 地 ,把 具有 (5s) (6) (7) (s) 

这 种 特点 的 数据 结构 称 为 树 形 结构 。 图 1.2 树 形 结构 

例 1.6 一 种 数据 结构 G=(CD,R), 其 中 

D= (112904 507} 

R={r} 

7 = (27 21 lA) X41) (2 32 207002)s 
oy ts BG DL a 9 yp 

对 应 的 图 形 如 图 1. 3 所 示 。 

从 图 1. 3 可 以 看 出 ,~ 是 D 上 的 对 称 关系 ,为 了 简化 起 见 ,把 < xz,y > 和 <y,x > 这 两 个 
序 偶 用 一 个 无 序 对 (zx ,y) 来 代替 ,在 图 形 中 ,把 z 结 点 和 > 结 点 之 间 两 条 相反 的 弧 用 一 条 无 
向 边 来 代替 。 这 样 > 关系 可 改写 为 : r= 二 {(1,2),(1,4),(2,3),(2,6),(2,7),(3,7),(4,6)， 
(5,7)} ,对 应 的 图 形 如 图 1.4 所 示 。 


图 1.3 有 向 图 结构 图 1.4 无 向 图 结构 


不 难看 出 ,~ 是 人 员 之 间 的 友好 关系 。 

在 G 中 ,每 一 个 数据 元 素 有 任意 多 个 前 驱 元 素 和 任意 多 个 后 续 元 素 。 这 种 数据 结构 的 
特点 是 数据 元 素 之 间 的 M : N 联系 。 一 般 地 ,把 具有 这 种 特点 的 数据 结构 称 为 图 形 结构 。 

上 述 数 据 结构 定义 中 的 “关系 ”, 描 述 的 是 数据 元 素 之 间 抽 象 化 的 相互 关系 ,这 种 数据 元 
素 之 间 客 观 存 在 的 逻辑 关系 通常 称 为 逻辑 结构 。 它 与 数据 的 存储 无 关 , 是 独立 于 计算 机 的 。 

根据 数据 元 素 之 间 关 系 的 不 同 特性 ,有 下 列 4 类 基本 逮 辑 结构 。 

@ 线性 结构 : 数据 结构 中 的 元 素 之 间 存 在 一 对 一 的 相互 关系 。 

@ 树 形 结构 : 数据 结构 中 的 元 素 之 间 存 在 一 对 多 的 相互 关系 。 

@ 图 形 结构 : 数据 结构 中 的 元 素 之 间 存 在 多 对 多 的 相互 关系 。 

@ 集合 结构 : 数据 结构 中 的 元 素 之 间 除 了 “同属 一 个 集合 "的 相互 关系 之 外 , 别 无 其 他 

图 1.5 为 上 述 4 种 基本 逻辑 结构 的 关系 图 。 


G 
CC 

(a) 线性 结构 (b) 树 形 结构 

O 

Se 

(ce) 图 形 结构 (d) 集合 结构 


图 1.5 基本 逻辑 结构 示意 图 


6. 物理 结构 


物理 结构 (physical structure ,或 称 存储 结构 ) 是 数据 结构 在 计算 机 中 的 表示 (又 称 映 
像 ) , 它 包 括 数据 元 素 的 机 内 表示 和 关系 的 机 内 表示 。 由 于 具体 实现 的 方法 有 顺序 ,链接 、 索 
引 、 散 列 等 多 种 ,所 以 ,一 种 数据 结构 可 表示 成 一 种 或 多 种 存储 结构 。 下 面 分 别 讨论 。 
1) 数据 元 素 的 映像 方法 
用 二 进 制 位 (bit) 的 位 串 表 示 数 据 元 素 。 通 常 称 这 个 位 串 为 结 点 (node) 。 当 数据 元 素 
由 若干 个 数据 项 组 成 时 ,位 串 中 与 各 数据 项 对 应 的 子 位 串 称 为 数据 域 (data field) 。 因 此 , 结 
点 是 数据 元 素 的 机 内 表示 (或 机 内 映像 )。 例 如 : 
(321)1 = (501), = (101000001), 
A=(101), = (001000001);, 
2) 关系 的 映像 方法 (表示 <z,y > 的 方法 ) 
数据 元 素 之 间 关 系 的 机 内 表示 可 以 分 为 顺序 映像 和 非 顺序 映像 ,常用 两 种 存储 结构 : 
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顺序 存储 结构 和 链 式 存储 结构 。 顺 序 映 像 借助 元 素 在 存储 器 中 的 相对 位 置 来 表示 数据 元 素 
之 间 的 逻辑 关系 。 非 顺序 映像 借助 指示 元 素 存储 位 置 的 指针 (pointer) 来 表示 数据 元 素 之 
间 的 逻辑 关系 。 下 面 的 例子 说 明了 这 两 种 存储 方法 。 

例 1.7 序列 A=(12,23,44,33,65) 的 两 种 存储 结构 。 

假设 用 2 字 节 存储 一 个 数据 元 素 。 该 序列 的 两 种 存储 结构 如 图 1.6 所 示 。 


地 址 数据 地 址 数据 指针 


0100 12 0100 44 | 0110 

0102 23 0104 23 | 0100 

0104 44 0108 12 | 0104 
| 


0106 33 010C 65 0 
0108 65 0110 33 010C 


010A 0114 
010C 
(a) 序列 4 的 顺序 存储 结构 (b) 序列 4 的 链 式 存储 结构 
图 1.6 序列 A 存储 结构 示意 图 


图 1.6(a) 表 示 顺 序 存 储 结构 ,其 中 首 元 素 12 存放 在 地 址 为 0100 的 单元 中 , 占 2 字 节 ; 
第 2 个 元 素 存放 在 地 址 为 0102 的 单元 中 , 占 2 字 节 ; 以 此 类 推 。 由 这 种 存储 方式 ,很 容易 
确定 序列 中 任意 一 个 元 素 的 位 置 , 如 第 3 个 元 素 的 位 置 是 0100 十 (3 一 1) X2 王 0104, 可 以 通 
过 计算 公式 直接 确定 。 

图 1.6(b) 表 示 链 式 存储 结构 ,其 中 首 元 素 12 存放 在 地 址 为 0108 的 单元 中 ; 第 2 个 元 
素 的 存储 位 置 由 首 元 素 的 指针 域 指示 出 来 ,为 地 址 是 0104 的 单元 ; 第 3 个 元 素 的 存储 位 置 
由 第 2 个 元 素 的 指针 域 指示 出 来 ,为 地 址 是 0100 的 单元 ; 以 此 类 推 。 最 后 一 个 元 素 存储 在 
地 址 为 010C 的 单元 中 , 它 的 指针 域 存放 了 一 个 空 指针 。 在 这 种 存储 方式 中 ,要 确定 序列 中 
任意 一 个 元 素 的 位 置 ,都 必须 从 第 1 个 元 素 开 始 ,“ 顺 芯 摸 瓜 ”"。 如 要 确定 第 3 个 元 素 的 位 
置 ,必须 先 由 首 元 素 的 指针 域 找到 第 2 个 元 素 的 存储 位 置 , 再 由 第 2 个 元 素 的 指针 域 找到 第 
3 个 元 素 的 存储 位 置 0100 。 

上 述 两 种 存储 结构 各 有 其 优 缺 点 ,相关 内 容 将 在 后 的 章节 中 进一步 讨论 。 

在 不 同 的 编程 环境 中 ,存储 结构 可 能 有 不 同 的 描述 方法 。 当 用 高 级 程序 设计 语言 进 
编程 时 ,通常 可 用 编程 语言 中 提供 的 数据 类 型 描述 存储 结构 。 lepersenedandi 
具有 的 “数组 ”类 型 来 表示 顺序 存储 结构 ,用 “指针 ”来 表示 链 式 存储 结构 。 


7. 数据 类 型 


数据 类 型 (data type) 是 与 数据 结构 密切 相关 的 一 个 概念 。 数 据 是 按 数据 结构 分 类 的 ， 
具有 相同 数据 结构 的 数据 属 同一 类 。 同 一 类 数据 的 全 体 称 为 一 个 数据 类 型 。 

在 高 级 程序 设计 语言 中 ,数据 类 型 是 数据 的 一 种 属性 ,用 来 说 明 一 个 数据 在 数据 分 类 中 
的 归属 。 它 限定 了 该 数据 占据 内 存 的 字 节 数 、 取 值 范围 .其 上 可 进行 的 操作 。 所 以 ,数据 类 
型 又 被 认为 是 一 个 值 的 集合 和 定义 在 这 个 值 集合 上 的 一 组 操作 的 总 称 。 

按 值 是 否 可 分 解 , 高 级 语言 中 的 数据 类 型 可 以 分 为 两 类 : 原子 类 型 和 结构 类 型 。 原 子 
类 型 的 值 是 不 可 分 解 的 ,如 C 语言 中 的 基本 类 型 ( 整 型 、 浮 点 型 字符 型 、 枚 举 类 型 ) 和 指针 
类 型 等 。 结 构 类 型 的 值 是 由 若干 成 分 按 某 种 结构 组 成 的 ,因而 是 可 以 分 解 的 ,并 且 它 的 成 分 


既 可 以 是 非 结 构 化 的 ,也 可 以 是 结构 化 的 ;如 C 语言 中 的 数组 类 型 结构 体 类 型 .共用 体 ( 联 
合 ) 类 型 等 。 


8. 抽象 数据 类 型 


抽象 数据 类 型 (ADT) 是 指 一 个 数学 模型 以 及 定义 在 此 数学 模型 上 的 一 组 操作 。 抽 象 
数据 类 型 的 定义 仅 取 决 于 它 的 一 组 逻辑 特性 ,而 与 其 在 计算 机 内 部 如 何 表示 和 实现 无 关 。 
抽象 数据 类 型 和 数据 类 型 实质 上 是 一 个 概念 。 例 如 ,整数 类 型 就 是 一 个 抽象 数据 类 型 ， 
尽管 它们 在 不 同 处 理 器 上 的 实现 方法 可 以 不 同 ,但 由 于 其 定义 的 数学 特性 相同 ,在 用 户 看 来 
都 是 相同 的 。 因 此 ,抽象 的 意义 在 于 数据 类 型 的 数学 抽象 特性 。 男 外 抽象 数据 类 型 的 范畴 
更 广 , 它 不 再 局 限于 处 理 器 中 已 定义 并 实现 的 数据 类 型 ,还 包括 用 户 在 设计 软件 系统 时 自己 
定义 的 数据 类 型 。 
抽象 数据 类 型 是 描述 数据 结构 的 一 种 理论 工具 ,其 目的 是 使 人 们 能 够 独立 于 程序 的 实 
现 细节 来 理解 数据 结构 的 特性 。 一 种 数据 结构 被 视 为 一 个 抽象 数据 类 型 , 即 数据 结构 的 数 
据 视 为 抽象 数据 类 型 的 数据 对 象 , 数 据 结构 的 关系 视 为 抽象 数据 类 型 的 数据 关系 ,数据 结构 
上 的 算法 视 为 抽象 数据 类 型 的 基本 操作 。 抽 象 数据 类 型 的 特征 是 将 使 用 与 实现 相 分 离 ,从 
而 实现 封装 和 信息 隐藏 。 抽 象 数据 类 型 通过 一 种 特定 的 数据 结构 在 程序 的 某 个 部 分 得 以 实 
现 , 而 在 设计 使 用 抽象 数据 类 型 的 程序 时 ,只 关心 这 个 数据 类 型 上 的 操作 ,而 不 关心 数据 结 
构 的 具体 实现 。 
抽象 数据 类 型 可 用 三 元 组 (D,S ,P) 表 示 , 其 中 ,D 是 数据 对 象 ,S 是 D 上 关系 集合 ,P 
是 对 D 的 基本 操作 和 集合。 抽象 数 据 类 型 描述 的 一 般 形式 如 下 : 
aDr 抽象 数据 类 型 名 称 { 
数据 对 象 :< 数据 对 象 的 定义 > 
数据 关系 :< 数据 关系 的 定义 > 
基本 操作 :< 基本 操作 的 定义 > 
)anr 抽象 数据 类 型 名 称 
其 中 ,数据 对 象 和 数据 关系 的 定义 用 集合 描述 。 基 本 操作 的 定义 格式 为 : 
返回 类 型 基本 操作 名 (参数 表 ) 


例 1.8 复数 抽象 数据 类 型 。 
复数 抽象 数据 类 型 可 以 定义 为 如 ADT1. 1 所 示 的 形式 。 
ADT1. 1 复数 抽象 数据 类 型 
ADT complex{ 
数据 对 象 : D== {ei ,es| ei ,es 为 实数 } 
数据 关系 : R, 一 {< ei ,es>| ei 是 复数 的 实数 部 分 ,es 是 复数 的 虚数 部 分 } 
基本 操作 : 
Initcomplex( &Z,v] ,v2) 
操作 结果 : 构造 复数 Z, 其 实 部 和 虚 部 分 别 被 赋予 参数 vl 和 v2 的 值 
Destroycomplex( &7) 
操作 结果 : 复数 Z 被 销毁 
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GetReal(Z, & Realpart) 
初始 条 件 : 复数 已 存在 
操作 结果 : 用 Realpart 返回 复数 Z 的 实 部 值 
GetImag (Z,& Imagpart) 
初始 条 件 : 复数 已 存在 
操作 结果 : 用 Imagpart 返回 复数 Z 的 虚 部 值 
Add(zl,z2,&sum) 
初始 条 件 : zl 和 z2 是 复数 
操作 结果 : 用 sum 返回 两 个 复数 z1 和 z2 的 和 
}ADT complex 
抽象 数据 类 型 可 通过 固有 数据 类 型 来 表示 和 实现 , 即 利 用 编程 环境 中 已 存在 的 数据 类 
型 来 说 明 新 的 结构 ,用 已 经 实现 的 操作 来 组 合 新 的 操作 。 抽 象 数 据 类 型 的 设计 者 根据 抽象 
数据 类 型 的 描述 给 出 操作 的 具体 实现 ,抽象 数据 类 型 的 使 用 者 依据 这 些 描述 使 用 抽象 数据 
类 型 。 
抽象 数据 类 型 的 具体 实现 依赖 于 所 选择 的 高 级 语言 功能 。 常 见 的 实现 抽象 数据 类 型 方 
法 有 面向 过 程 的 程序 设计 方法 和 面向 对 象 的 程序 设计 方法 。 本 书 主要 采用 面向 过 程 的 程序 
设计 方法 来 实现 抽象 数据 类 型 ,同时 在 每 一 章 最 后 一 节 概 要 说 明了 怎样 用 面向 对 象 的 程序 
设计 方法 来 实现 抽象 数据 类 型 。 
在 面向 过 程 的 C 语言 中 ,用 户 可 以 自己 定义 数据 类 型 ,同时 借助 于 函数 ,利用 固有 的 数 
据 类 型 来 实现 抽象 数据 类 型 。 对 使 用 已 定义 的 抽象 数据 类 型 的 用 户 来 说 ,必须 将 已 定义 的 
抽象 数据 类 型 说 明 以 及 机 数 说 明 骨 入 到 自己 程序 的 适当 位 置 。 在 C 语言 中 ,抽象 数据 类 型 
的 设计 和 使 用 方法 详 见 1.4 节 。 
在 面向 对 象 程序 设计 的 C++ 语言 中 ,借助 对 象 描述 抽象 数据 类 型 ,存储 结构 的 说 明和 操 
作 函 数 的 说 明 被 封装 到 类 中 ,属于 某 个 类 的 具体 变量 称 为 对 象 。 数 据 结构 的 定义 为 对 象 的 
属性 域 ( 或 数据 成 员 ) ,算法 的 定义 在 对 象 中 称 为 方法 (或 成 员 函 数 )。 在 C++ 语言 中 ,抽象 数 
据 类 型 的 设计 和 使 用 方法 详 见 1.5 节 。 


(2 算法 与 数据 结构 


著名 的 计算 机 科学 家 N. Wirth 教授 曾 提出 一 个 公式 : 
算法 十 数据 结构 = 程序 (的 
式 (1.2) 清 楚 地 揭示 了 算法 和 数据 结构 这 两 个 计算 机 科学 的 重要 支柱 的 重要 性 和 统一 
性 。 也 就 是 说 , 既 不 能 离开 数据 结构 去 抽象 地 分 析 求 解 问题 的 算法 ,也 不 能 脱离 算法 去 孤立 
地 研究 程序 的 数据 结构 。 因 此 ,在 初步 了 解数 据 结 构 的 基本 概念 和 术语 之 后 ,还 应 该 讨论 算 
法 的 概念 。 


1.2.1 算法 的 概念 
算法 (algorithm) 是 对 特定 问题 求解 步骤 的 一 种 描述 , 它 是 指令 的 有 限 序列 ,其 中 每 一 


条 指令 表示 一 个 或 多 个 操作 。 

通常 ,一 个 算法 必须 具备 以 下 5 个 重要 特性 。 

(1) 有 穷 性 : 一 个 算法 对 任何 合法 的 输入 值 必 须 总 是 在 执行 有 穷 步 之 后 结束 ,而 且 每 
一 步 都 可 在 有 穷 的 时 间 内 完成 。 

(2) 确定 性 : 算法 中 每 一 条 指令 必须 有 确切 的 含义 ,阅读 时 不 会 产生 二 义 性 。 并且, 在 
任何 条 件 下 ,算法 只 有 唯一 的 一 条 执行 路 径 , 即 对 于 相同 的 输入 只 能 得 到 相同 的 输出 。 

(3) 可 行 性 : 一 个 算法 是 可 行 的 ,算法 中 描述 的 操作 都 可 以 通过 已 经 实现 的 基本 运算 
执行 有 限 次 来 实现 。 

(4) 输入 : 一 个 算法 有 n(n 三 0) 个 数据 的 输入 。 

(5) 输出 : 一 个 算法 必须 有 一 个 或 多 个 有 效 信息 的 输出 , 它 是 与 输入 有 某 种 特定 关系 
的 量 。 

算法 的 含义 与 程序 十 分 相似 ,但 二 者 是 有 区 别 的 。 一 个 程序 不 一 定 满足 有 穷 性 。 例 如 
操作 系统 ,只 要 整个 系统 不 被 破坏 , 它 就 永远 不 会 停止 ,即使 没有 作业 要 处 理 , 它 仍 处 于 一 个 
等 待 循 环 中 ,以 等 待 新 作业 的 进入 。 因 此 ,操作 系统 不 是 一 个 算法 。 另 外 ,程序 中 的 指令 必 
须 是 机 器 可 执行 的 ,而 算法 中 的 指令 则 无 此 限制 。 但 是 一 个 算法 若 用 机 器 可 执行 的 指令 来 
编写 , 它 就 是 一 个 程序 。 

在 计算 机 领域 ,一 个 算法 实质 上 是 针对 所 处 理 问 题 的 需要 ,在 数据 的 迎 辑 结构 和 物理 结 
构 的 基础 上 ,施加 的 一 种 运算 。 由 于 数据 的 逻辑 结构 和 物理 结构 不 是 唯一 的 ,在 很 大 程度 上 
可 以 由 用 户 自行 选择 和 设计 ,所 以 处 理 同 一 个 问题 的 算法 也 不 是 唯一 的 。 另 外 ,即使 对 于 相 
同 的 逻辑 结构 和 物理 结构 ,其 算法 设计 的 思想 和 技巧 不 同 ,编写 出 的 算法 也 大 不 相同 。 

学 习 数据 结构 这 门 课程 的 目的 ,就 是 要 能 够 根据 问题 的 需要 ,为 待 处 理 的 数据 选择 合适 
的 逻辑 结构 和 物理 结构 ,进而 设计 出 比较 满意 的 高 效 算法 。 


1.2.2 描述 算法 的 方法 


算法 可 以 用 自然 语言 .程序 设计 语言 类 程序 设计 语言 .流程 图 等 来 描述 。 自 然 语言 便 
于 读者 阅读 ,但 容易 产生 二 义 性 , 且 不 便 转 换 为 用 高 级 语言 编写 的 程序 。 用 程序 设计 语言 来 
描述 算法 ,可 以 直接 运行 验证 ,但 存在 烦琐 等 问题 。 所 谓 类 程序 设计 语言 ,是 对 标准 程序 设 
计 语 言 的 一 种 简单 的 扩充 , 既 便于 读者 阅读 ,又 能 容易 地 转换 为 用 高 级 语言 编写 的 程序 ,但 
在 验证 算法 的 过 程 中 ,存在 一 些 语法 问题 。 采 用 流程 图 的 方式 虽然 直观 ,但 也 存在 不 易 转 换 
的 问题 。 为 了 方便 验证 ,本 书 中 讨论 的 算法 主要 采用 标准 C 语言 作为 描述 工具 。 关 于 用 
C 语言 描述 算法 的 方法 参见 1.4 节 。 为 了 帮助 读者 更 好 地 体会 面向 对 象 的 思想 ,在 每 章 的 
最 后 一 节 用 C++ 语 言 描述 了 各 种 数据 结构 。 


1.2.3 算法 分 析 


设计 算法 时 ,通常 应 考虑 达到 以 下 目标 。 

(1) 正确 性 (correctness): 算法 应 能 正确 地 实现 预定 的 功能 ( 即 处 理 要 求 )。 对 算法 是 
否 正确 的 理解 有 以 下 4 个 层次 。 

Q 程序 中 不 含 语法 错误 ; 
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@ 程序 对 于 几 组 输入 数据 能 够 得 出 满足 要 求 的 结果 ; 

@ 程序 对 于 精心 选择 的 .典型 的 .苛刻 且 带 有 刁难 性 的 几 组 输入 数据 能 够 得 出 满足 要 
求 的 结果 ; 

@ 程序 对 于 一 切合 法 的 输入 数据 都 能 得 出 满足 要 求 的 结果 。 

通常 以 第 @ 层 意义 的 正确 性 作为 衡量 一 个 算法 是 否 合格 的 标准 。 

(2) 可 读 性 (readability) : 算法 应 易于 阅读 和 理解 ,以 便于 调试 .修改 和 扩充 。 

(3) 健壮 性 (robustness) : 当 输入 数据 非法 时 ,算法 也 能 适当 地 做 出 反应 或 进行 处 理 ， 
而 不 会 产生 莫名 其 妙 的 输出 结果 。 

(4) 高 效率 (efficient) : 即 要 求 执行 算法 的 时 间 短 ,所 需要 的 存储 空间 少 。 

虽然 在 应 用 中 总 是 希望 选用 一 个 占用 存储 空间 小 、 运 行 时 间 短 、 其 他 性 能 也 好 的 算法 ， 
然而 实际 上 却 很 难 做 到 十 全 十 美 ,因为 上 述 要 求 有 时 相互 抵触 。 要 节约 算法 的 时 间 往 往 要 
以 牺牲 更 多 的 空间 为 代价 ; 而 为 了 节省 空间 又 可 能 要 以 更 多 的 时 间 为 代价 。 因 此 只 能 根据 
具体 情况 有 所 侧重 。 若 程序 使 用 次 数 较 少 , 则 力求 算法 简明 易 懂 , 易 于 转换 为 程序 ; 对 于 反 
复 多 次 使 用 的 程序 ,应 尽 可 能 选用 快速 的 算法 ; 若 待 解决 的 问题 数据 量 极 大 ,机 器 的 存储 空 
间 较 小 , 则 相应 的 算法 主要 考虑 如 何 节省 空间 。 

要 得 到 一 个 高 效 的 算法 ,在 设计 算法 时 ,就 要 对 算法 的 执行 时 间 有 一 个 客观 的 分 析 和 
判断 。 

运算 时 间 是 指 一 个 算法 在 计算 机 上 运算 所 花费 的 时 间 , 它 与 简单 操作 (如 赋值 操作 、 转 
向 操作 .比较 操作 等 ) 的 次 数 有 关 。 算 法 由 控制 结构 和 简单 操作 组 成 ,算法 的 执行 时 间 为 简 
单 操作 的 执行 次 数 与 简单 操作 的 执行 时 间 的 乘积 ,而 简单 操作 的 执行 时 间 是 由 计算 机 硬件 
环境 决定 的 ,与 算法 无 关 。 因 此 ,算法 的 执行 时 间 与 简单 操作 执行 次 数 ( 也 称 为 频 度 ) 成 正 
比 。 一 般 地 ,把 算法 中 包含 简单 操作 次 数 的 多 少 称 为 算法 的 时 间 复 杂 度 , 它 是 一 个 算法 运行 
时 间 的 相对 量度 。 

问题 的 规模 是 算法 求解 问题 的 输入 量 , 一 般 用 整数 表示 。 例 如 ,在 排序 问题 中 ,n 表 
示 待 排序 元 素 的 个 数 ; 在 矩阵 求 逆 中 ,” 表示 矩阵 的 阶 数 ; 在 图 的 遍历 中 ,n 表示 图 的 顶点 
数 或 边 数 等 。 

算法 的 时 间 复 杂 度 可 看 成 是 问题 规模 的 函数 , 记 为 T(n)。 

例 1.9 分 析 算法 1.1 和 算法 1. 2 的 时 间 复 杂 度 。 

算法 1.1 累加 求 和 。 


int sum( int a[ ], int n) 


int s=0,i; //(1) 给 累加 变量 s 赋 初 值 

for (i =0; i<n; i++) //(2) 进 行 累加 求 和 
s+=a[i]; 

return(s) ; //(3) 返 回 s 的 值 


第 (1)、(2) 步 不 是 简单 操作 ,可 将 算法 改写 为 : 


int sum( int a[ ], int n) 


int s,i; 


Ss= 0; //1 次 
= 0 //1 次 
while (i<n) //n+1 次 
{ 
s+=a[i]; /jn 次 
4+; //n 次 
} 
return (s); /人 /1 次 


} 


因此 ,算法 1.1 的 时 间 复 杂 度 为 : T(z) 一 32 十 4。 

算法 1.2 和 矩阵 相 加 。 

/av be 分 别 为 a 阶 矩阵 ,ai 表示 两 个 加 数 ,c 表示 和 

void matrixadd(int a[ ][n], int b[][n]，int c[][n]) 

int i,j; 

for (i=0; i<n; i++) 
for (j=0; j<n; j++) 
c[il[j] = a[il[j]+ b[i][j]; 

} 

通过 与 算法 1. 1 相似 的 分 析 过 程 ,可 得 到 算法 1. 2 的 时 间 复 杂 度 为 : T(x) 二 dn 十 5n 十 2。 

算法 1. 1 和 算法 1. 2 的 时 间 复 杂 度 比较 容易 计算 ,因为 算法 比较 简单 ,同时 for 循环 中 
的 循环 次 数 是 固定 的 。 但 是 当 算 法 较 复 杂 , 同 时 包含 有 while 等 循环 时 ,其 时 间 复 杂 度 的 计 
算 就 相当 困难 了 。 实 际 上 ,一 般 也 没有 必要 精确 地 计算 出 算法 的 时 间 复 杂 度 ,只 要 大 致 计算 
出 相应 的 数量 级 (order) 即 可 。 

设 T(n) 的 一 个 辅助 函数 为 f(n), 随 着 问题 规模 的 增长 ,算法 执行 时 间 的 增长 率 和 
了 (0) 的 增长 率 相同 , 则 可 记 作 : 

T(n)=0O0(f(n)) 

当 问 题 的 规模 n 趋向 无 穷 大 时 ,把 时 间 复杂 度 T(x) 的 数量 级 ( 阶 )O(f (n)) 称 为 算法 
的 ( 浙 近 ) 时 间 复杂 度 。 

算法 的 时 间 复 杂 度 采用 数量 级 的 形式 表示 后 ,将 给 求 一 个 算法 的 T(z) 带 来 很 大 的 方 
便 , 一 般 只 要 分 析 循 环 体内 简单 操作 的 执行 次 数 即 可 。 

估算 算法 的 时 间 复 杂 度 常用 方法 如 下 。 

(1) 多 数 情况 下 , 求 最 深层 循环 内 的 简单 语句 ( 原 操作 ) 的 重复 执行 的 次 数 。 

(2) 当 难 以 精确 计算 原 操作 的 执行 次 数 时 ,只 需求 出 它 关 于 的 增长 率 或 阶 即 可 。 

(3) 当 循 环 次 数 未知 ( 与 输入 数据 有 关 ) , 求 最 坏 情 况 下 的 简单 语句 ( 原 操作 ) 的 重复 执 


行 的 次 数 。 
例 1.10 估算 算法 的 时 间 复杂 度 。 
程序 段 1: 
X=Xx+1; 


程序 段 2: 
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for(i=1;i<=n; i++) 
FE 


程序 段 3: 


for(i=1;i<=n; i++) 
for(j=1;j<=n; j++) 
x=xX+1; 


程序 段 4: 


for(i=1;i<=n; i++) 
for(j=i;j<=n; j++) 
x=x+1; 


语句 x 二 x 十 1 的 执行 次 数 ( 或 频 度 ) 分 别 为 1 nn? 和 n(n 十 1)/2, 则 这 4 个 程序 段 的 渐 
近 时 间 复 杂 度 分 别 是 O(1)、O(n)、O(n?) 和 O(n?)。 
程序 段 5: 


// 将 a 中 整数 序列 重新 排列 成 自 小 至 大 有 序 的 整数 序列 
void bubble sort(int a[ ], int n) 
{ 
int temp, i,j,change= 1; 
for(i=n-1, change=1; i>0 && change; i--) 
{ 
change = 0; 
for (j=0; j<i; j++) 
if (a[j] > a[j+1]) 
{ 
temp=a[j]; alj] =a[lj+1]; alj+1]= temp; 
change = 1; 


} 
上 述 程 序 段 中 ,基本 操作 为 赋值 操作 ,由 于 次 数 是 未 知 的 ,因此 考虑 最 坏 情况 下 的 次 数 
为 n(n 十 1)/2, 渐 进 时 间 复 杂 度 为 O(n?)。 
以 下 是 具有 代表 性 的 工 (x) 函数 。 


多 项 式 时 间 算 法 的 关系 为 : 
O(DW<OUbn)<Om) <Onlbna <0 <OWn’) 
指数 时 间 算 法 的 关系 为 : 
O(2")<O(n!)<On") 


当 n 值 很 大 时 ,指数 时 间 算 法 和 多 项 式 时 间 算 法 在 所 需 时 间 上 相差 非常 悬殊 。 因 此 ， 
只 要 有 人 能 将 现 有 指数 时 间 算 法 中 的 任何 一 个 算法 化 简 为 多 项 式 时 间 算 法 , 那 就 取得 了 一 
个 伟大 的 成 就 。 
为 了 讨论 算法 所 需 的 存储 量 , 本 书 将 空间 复杂 度 函 数 作 为 算法 所 需 的 存储 空间 的 量度 。 
算法 的 空间 复杂 度 为 : 
S(n)=O(g(n)) 


它 表 示 随 着 问题 规模 ”的 增 大 ,算法 运行 所 需 存 储量 的 增长 率 与 g(z) 的 增长 率 相同 。 

算法 的 存储 量 包 括 输入 数据 所 占 空间 ,程序 本 身 所 占 空间 和 辅助 变量 所 占 空间 。 

由 于 输入 数据 所 占 空间 只 取决 于 问题 本 身 ,和 算法 无 关 , 所 以 只 需要 分 析 除 输入 和 程序 
之 外 的 额外 空间 。 

若 所 需 额 外 空间 相对 于 输入 数据 量 来 说 是 常数 , 则 称 此 算法 为 原 地 工作 。 

若 所 需 额 外 空间 依赖 于 特定 的 输入 , 则 通常 按 最 坏 情况 考虑 。 


(3 学 习 算法 与 数据 结构 的 意义 和 方法 


算法 与 数据 结构 是 计算 机 及 相关 专业 的 核心 课程 之 一 ,在 众多 的 系统 软件 和 应 用 软件 
中 都 涉及 算法 和 数据 结构 。 因 此 , 仅 掌 握 几 种 计算 机 语言 难以 应 对 众多 复杂 的 问题 ,要 想 有 
效 地 使 用 计算 机 ,还 必须 学 习 算法 与 数据 结构 的 有 关 知 识 。 

算法 十 数据 结构 三 程序 。 它 揭示 了 程序 设计 的 实质 , 即 对 实际 问题 选择 一 种 好 的 数据 
结构 ,加 之 设计 一 个 好 的 算法 ,而 好 的 算法 在 很 大 程度 上 取决 于 描述 实际 问题 的 数据 结构 。 

例 1.11 电话 号 码 查 询问 题 。 

假定 要 编写 一 个 程序 ,查询 某 个 城市 或 单位 的 私人 电话 号 码 。 解 此 问题 首先 要 构造 一 
张 电话 号 码 登 记 表 , 表 中 每 个 结 点 存放 两 个 数据 项 : 姓名 和 电话 号 码 。 要 写 出 好 的 查询 算 
法 ,取决 于 这 张 表 的 结构 及 存储 方式 。 最 简单 的 方式 是 将 表 中 结 点 顺序 地 存储 在 计算 机 中 ， 
查找 时 从 头 开始 依次 查找 姓名 ,直到 找 出 正确 的 姓名 或 找 遍 整个 表 均 没有 找到 为 止 。 这 种 
查找 算法 对 于 一 个 不 大 的 单位 或 许 是 可 行 的 ,但 对 于 一 个 有 成 千 上 万 私人 电话 的 城市 就 不 
实用 了 。 人 然而 , 若 这 张 表 是 按 姓氏 排列 的 , 则 构造 另 一 张 姓氏 索引 表 , 采 用 如 图 1.7 所 示 的 
存储 结构 。 查 找 时 , 先 在 索引 表 中 查找 姓氏 ,然后 根据 索引 表 中 的 地 址 到 电话 号 码 登 记 表 中 
核查 姓名 ,这样 查 找 登记 表 时 就 无 须 查找 其 他 姓氏 的 名 字 了 。 因 此 ,在 这 种 新 的 结构 上 产生 
的 查找 算法 就 是 更 为 有 效 的 。 


姓名 电话 号 码 
张 三 
张 红 
姓名 地 址 i 
张 
和 Ee 
李 忠 


图 1.7 电话 号 码 查询 问题 的 索引 存储 


“算法 与 数据 结构 "这 门 课程 不 仅 具 有 很 强 的 理论 性 ,而 且 有 很 强 的 实践 性 。 因 此 ,学习 
本 门 课程 既 要 和 弄 清楚 主要 的 数据 结构 的 表示 及 操作 实现 的 方法 ,又 要 认真 地 通过 上 机 进 一 
步 学 习 编 程 方法 。 一 些 算法 (如 递归 调用 ) 往 往 需要 通过 上 机 调试 才能 加 深 理 解 ,豁然 开朗 。 
每 章 后 面 的 习题 ,可 以 选择 几 题 作为 上 机 作业 ,让 学 生 自 己 去 分 析 问 题解 决 问题 ,学 生 的 兴 
趣 、 主 动 性 、 对 本 课程 的 理解 往往 是 在 上 机 解决 问题 的 过 程 中 培养 起 来 的 。 在 解决 问题 的 过 
程 中 ,可 以 通过 学 生 间 的 相互 讨论 达到 事半功倍 的 效果 。 
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(1.4 C 语言 的 数据 类 型 及 其 算法 描述 

本 书 中 讨论 的 算法 ,主要 采用 标准 C 语言 作为 算法 的 描述 工具 。 为 了 便于 阅读 ,理解 、 
编写 算法 ,下 面 对 C 语言 中 的 有 关内 容 做 一 些 简 单 的 说 明 。 

1.4.1 C 语 言 的 基本 数据 类 型 概述 


如 前 所 述 ,C 语言 的 数据 结构 也 是 以 数据 类 型 的 形式 出 现 的 。 
在 C 语 言 中 的 变量 必须 * 先 定义 ,后 使 用 ” ,定义 变量 的 格式 如 下 : 
数据 类 型 ”变量 名 1, 变 量 名 2,…, 变量 名 n; 


C 语言 的 数据 类 型 如 下 : 
[ 整 型 
je 
CC an 
单 精度 型 
| 枚 举 类 型 
数组 类 型 
数据 类 型 -和 类 型 | 结构 休 类 型 
共用 体 (联合 ) 类 型 
指针 类 型 
空 类 型 


有 时 需要 自 定义 数据 类 型 ,其 格式 如 下 : 
typedef 类 型 名 标识 符 


其 中 ,类 型 名 为 已 定义 类 型 名 ,标识 符 为 新 类 型 名 。 
例如 : 


typedef int elemtype; // 把 elemtype 数据 类 型 定义 为 整 型 类 型 


1.4.2 C 语 言 的 数组 和 结构 体 数据 类 型 
1. 数组 


(1) 数组 类 型 特点 : 数据 元 素 类 型 相同 。 
(2) 数组 定义 格式 : 
元 素数 据 类 型 名 数组 名 [常量 表达 式 ]; 


(3) 数组 存储 结构 : 顺序 存储 (数组 名 代表 首 地 址 ) 。 
例如 : 


int a[ 4]; 


数组 a 的 存储 结构 如 图 1. 8 所 示 。 


地 址 
由 数组 的 顺序 存储 ,可 得 出 式 (1. 3) ,从 而 实现 数组 元 素 的 随机 ” “| ao | 3000 
访问 。 al] 3002 
Loc(a;) =loc(ao) 十 zx 工 (1.3) aD] 3004 
其 中 ,Loc(Ca;) 表 示 元 素 a; 的 地 址 ,loc(a。) 表 示 数 组 的 首 地 址 ,i 表 a3] | 3006 
示 下 标 ,L 表示 一 个 元 素 所 占 字 节 数 。 
(4) 数组 元 素 的 引用 。 
es 图 1.8 数组 a 的 存储 结构 
数组 名 [下 标 ] 


其 中 ,下 标 是 取 值 为 0~* 一 1 的 表达 式 ,n 为 数组 长 度 。 

关于 数组 元 素 的 引用 需 注意 以 下 几 点 。 

Q@ 数组 元 素 按 定义 数组 时 定义 的 数组 元 素 类 型 进行 操作 , 它 可 出 现在 C 语言 表达 式 中 
的 任何 地 方 。 


例如 : 

float a[ 4]; // 定 义 一 个 有 4 个 浮 点 型 元 素 的 数组 

a[3] =13.5; // 对 a[3] 按 浮 点 型 数据 操作 ,赋值 为 13.5 

@ C 语言 规定 只 能 逐个 引用 数组 元 素 而 不 能 一 次 引用 整个 数组 。 
例如 : 


float a[4],b[4]; ”// 定 义 两 个 有 4 个 浮 点 型 元 素 的 数组 

a=b; // 语 法 出 错 ;其 意图 是 想 把 b 数 组 的 所 有 元 素 赋值 到 a 数组 中 ,但 c 语 言 把 数组 

// 名 处 理 为 连续 存储 单元 的 首 地 址 (常量 ), 常量 不 能 出 现在 赋值 运算 符 的 左边 

(5) 字符 串 。 

多 个 字符 构成 的 序列 称 为 字符 串 。 字 符 串 分 为 字符 串 常量 和 字符 串 变量 。 

字符 串 常 量 是 由 双 引 号 括 起 来 的 多 个 字符 。 例 如 : "hello! "字符 串 常量 , 它 在 内 存 中 占 
7 字 节 ,因为 系统 在 每 个 字符 串 常量 后 附加 一 个 字符 \0' 作 为 字符 串 的 结束 标志 。 

C 语言 把 存放 字符 串 的 变量 表示 为 字符 数组 或 指向 字符 的 指针 。 例 如 : 

char s[7]; // 定 义 一 个 最 多 有 7 个 字符 的 字符 串 变量 

char x s; // 定 义 一 个 可 指向 任意 长 度 字符 串 的 字符 指针 变量 

字符 串 是 特殊 的 数组 , 既 可 对 每 个 数组 元 素 进行 逐个 操作 ,也 可 用 字符 串 处 理 函 数 对 字 
符 串 整体 进行 操作 。 

例 1.12 字符 串 的 处 理 。 


void main() 

{ 
char sl[5],s2[5]; 
scanf("%s%s",sl,s2); // 用 控制 符 s 表示 对 字符 串 输入 ,参数 用 数组 名 
printf("% s\n% s\n", sl, s2); 
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输入 : 


2. 结构 体 数据 类 型 


(1) 结构 体 数据 类 型 特点 : 数据 元 素 类 型 不 同 ,它们 常 作为 一 个 整体 出 现 。 

(2) 结构 体 的 说 明 : 要 定义 一 个 结构 体 类 型 的 变量 ,一 般 先 定义 结构 体 类 型 名 ,再 定义 
结构 体 类 型 的 变量 名 。 

结构 体 类 型 说 明 格式 为 : 


struct 结构 体 名 {成 员 列表 }; 
例如 : 


struct student 

{ int num; 
char name[10]; 
int age; 
float score; 


入 


上 述 语句 定义 了 一 个 由 4 个 成 员 所 构成 的 一 个 结构 体 类 型 student, 但 此 时 没有 变量 定 
义 , 即 没有 分 配 存储 单元 ,不 能 在 程序 中 直接 访问 结构 体 类 型 名 。 


结构 体 变 量 的 说 明 如 下 。 

形式 1: 

struct 结构 体 名 ”变量 名 ; 

例如 : 

struct student sl,s2;  // 定 义 两 个 结构 体 类 型 为 student 的 结构 体 变 量 
形式 2: 

struct 结构 体 名 {成 员 列 表 } 变 量 名 ; 

例如 : 


struct student 

{ int num; 
char name[10]; 
int age; 
float score; 


} a1,a2; // 定 义 两 个 结构 体 类 型 为 student 的 结构 体 变量 
形式 3: 


struct 
例如 : 


struct 


{成 员 列 表 } 变 量 名 ; 


{ int num; 
char name[10]; 
int age; 


float score; 


} sl1,s2; // 定 义 两 个 由 4 个 成 员 所 构成 的 结构 体 变量 

(3) 结构 体 变量 中 成 员 的 引用 。 

格式 : ax| ___ 3 2000 

结构 体 变量 名 .成 员 名 ; ay[ 33 

例如 :J 

struct {int x;float y;}a; 2006 

a.x=3; a.y=3.4; 

结构 体 变量 a 的 存储 结构 如 图 1.9 所 示 。 人 
存储 结构 


对 结构 体 变量 中 成 员 的 操作 , 按 定义 结构 体 类 型 时 该 成 员 的 类 


型 进行 操作 , 它 可 出 现在 C 语言 表达 式 中 的 任何 地 方 。 如 上 述 成 员 a. x 按 整 型 数据 操作 ， 
a.y 按 浮 点 型 数据 操作 。 


3. 结构 体 数组 


(1) 结构 体 数组 特点 : 数组 中 的 每 个 元 素 为 结构 体 类 型 。 
(2) 结构 体 数组 定义 如 下 。 


struct 结构 体 类 型 名 数组 名 [长 度 ]; 


S[0J.num 
S[0].age 
S[0].score 


S[3].num 
S[3].age 
S[3].score 
S[4].num 
S[4].age 
S[4].score 


2000 
2002 


2004 


20 2024 
78.5 2026 
2028 
2032 
2034 


2036 


图 1.10 结构 体 数 组 的 存储 结构 


struct student 


{int num; 


int age; 


(3) 结构 体 数组 的 引用 。 
结构 体 数组 元 素 的 引用 格式 : 


数组 名 [下 标 表 达 式 ] 
它 按 数组 元 素 的 类 型 (结构 体 类 型 ) 操 作 , 不 能 对 结构 体 


类 型 做 整体 操作 ,只 能 分 别 对 其 成 员 进 行 操作 。 
结构 体 数 组 元 素 成 员 的 引用 格式 : 


数组 名 [下 标 表达 式 ] .成 员 名 


它 按 结构 体 成 员 类 型 操作 。 
例 1.13 结构 体 数 组 举例 。 
程序 段 如 下 ,其 存储 结构 如 图 1. 10 所 示 。 
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float score; 


jstsls // 定 义 一 个 由 5 个 结构 体 元 素 组 成 的 数组 s 
s[3].age = 20; // 对 数组 s 的 3 号 元 素 (结构 体 类 型 ) 不 能 整体 操作 
// 现 对 它 的 age 成 员 ( 整 型 ) 进 行 赋值 操作 
s[3]. score= 78.5; // 对 3 号 元 素 的 score 成 员 ( 浮 点 型 ) 进 行 赋值 操作 


1.4.3 C 语 言 的 指针 类 型 概述 
1. 指针 类 型 特点 

其 值 是 某 一 存储 单元 地 址 的 变量 。 

2. 指针 类 型 变量 的 定义 

指针 类 型 变量 的 定义 格式 : 

类 型 标识 符 * 变量 名 ; 


其 中 ,类 型 标识 符 是 该 指针 变量 所 指向 的 存储 单元 (指针 变量 的 对 象 ) 的 数据 类 型 。 


例如 : 
int *p; // 定 义 一 个 指向 整 型 存储 单元 的 指针 变量 


说 明 : 要 访问 指针 变量 所 指向 的 存储 单元 (对 象 ) ,必须 先 对 指针 变量 赋值 。 
例如 : 


int *p,a; // 定 义 一 个 指向 整 型 存储 单元 的 指针 变量 p 和 一 个 整 型 变量 a 
p= &a; // 对 pp 赋值 为 a 的 地 址 , 即 p 的 值 目前 是 a 变量 (存储 单元 ) 的 地 址 


3. 与 指针 有 关 的 运算 


(1) &: 取 操 作对 象 (内 存单 元 ) 的 内 存 地 址 。 
(2) * : 取 指针 所 指向 的 存储 单元 的 内 容 , 即 间接 引用 存储 单元 (指针 对 象 ) 的 内 容 。 
例如 : 


int x*p; // 定 义 整 型 指针 变量 p 

int i; 

p= &i; // 指 针 变 量 p 赋值 

xp=3; // 对 p 所 指向 的 存储 单元 赋值 ,此 时 相当 于 将 变量 i 赋值 为 3 


注意 :“int *p; ?语句 中 关 为 定义 指针 变量 的 标志 ,而 “*p 一 3; ”语句 中 关 为 间接 引用 


运算 符 , 相 当 于 用 指针 变量 对 变量 i 赋值 。 


例 1.14 指针 & 与 * 运 算 举 例 。 
程序 段 如 下 ,其 示意 图 如 图 1. 11 所 示 。 
int i, xP,I=3,J; // 内 存 分 配 如 图 1.11(a) 所 示 


P= &l; // 执 行 结果 如 图 1.11(b) 所 示 
d= PB; // 执 行 结果 如 图 1.11(c) 所 示 


P I(*P) 
简化 为 : 2002 | 2002 | 3 
Pp 2002 2000 
I 3 加 2002 
进一步 简化 为 : 1 
J 2004 P 一 -一 一 | 和 
(b) 


图 1.11 指针 & 和 x* 运 算 示 意图 


4. 指针 的 使 用 和 运算 


1) 赋值 运算 
对 象 类 型 相同 的 指针 变量 之 间 可 以 相互 赋值 ,表示 指向 同一 对 象 。 
例如 : 


int * pl, * p2,a; 


pl = ga; // 指 针 赋 值 运算 

p2 = pl; // 此 时 ,a 既是 pl 的 对 象 ,又 是 p2 的 对 象 

其 执行 结果 如 图 1. 12(a) 所 示 。 

2) 算术 运算 

例如 : 

p++t; //p 指向 下 一 对 象 单元 ,p 的 值 不 是 增加 1, 而 是 增加 对 象 类 型 占 的 字 节 数 
例如 : 


int A[4], * p; 
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p=A; 
ptt; 


其 执行 结果 如 图 1. 12(b) 所 示 。 


A[O] 2000 
pl a AI 120027 1 
1 
1 
~ AD] 2004 1 
1 
* 
i AD] 
*p2 LL 2000 2002 
p2 
b 2000 2008 
(a) (b) 


图 1.12 指针 赋值 运算 与 算术 运算 示意 图 

注意 : 数组 名 与 指针 都 表示 地 址 ,但 数组 名 为 地 址 常量 ,指针 为 变量 ,指针 可 以 指向 不 
同 的 地 址 (对 象 ) 。 

3) 与 指针 有 关 的 库 函 数 

与 指针 有 关 的 库 函 数 如 表 1.2 所 示 。 


表 1.2 与 指针 有 关 的 库 函数 


函数 名 函数 和 形 参 类 型 功 能 

malloc void * malloc(unsigned size) 分 配 size 字 节 存储 区 

free void free(void * p) 释放 p 所 指向 的 存储 区 

realloc void * realloc(void * p,unsigned size) 将 p 所 指出 的 已 分 配 内 存 区 的 大 小 改 为 size 


5. 指向 数组 元 素 的 指针 变量 


当 数 组 元 素 的 类 型 和 指针 变量 类 型 相同 时 ,可 以 将 数组 名 赋值 给 指针 变量 ,使 该 指针 变 
量 指 向 数组 元 素 ,这 样 , 对 数组 元 素 就 可 以 通过 下 标 法 或 指针 法 来 访问 。 

int a[10], * p; 

p= ga[0]; // 或 p=a; 这 样 p 为 指向 数组 元 素 的 指针 

此 时 ,p 十 i,a 十 i, &a[ 让 三 者 等 价 ,都 表示 a[ 让 元 素 的 地 址 。 

同时 , * (p 十 站, (a 十 让 ,x &&a[ 记 和 a[ 训 四 者 等 价 , 都 表示 a[ 记 元 素 的 值 。 

1) 下 标 法 

void main() 

{ 


int i,min, max,a[10]; 


for (i=0;i<10;i++) 


scanf("%d",&a[il]); 
min= max= a[0]; 
for (i=1;i<10;i+t+) 
{ 
if (a[i]> max) max=a[i]; 
if (a[i]<min) min=a[i]; 
} 
printf("max= 多 dmin= %S d\n",max,min); 


有 
2) 指针 法 


void main() 
{ 
int * p,min,max,a[10]; 
for (p=a;p<at+10;p++) 
scanf("%d",p); 
p=a; 
min= max= #*p; 
for (p=at+1;p<at+10;p+t+) 
{if (*P>max) max= *p; 
证 (*p<min) min= x*p; 
} 
printf("max= %d,min= %d\n",max,min); 


} 
有 如 下 定义 : 


#define N10 
int x*pl, * p2,a[N],b[N]; 


(1) “pl 三 &a[N 一 1]” 等 价 的 表示 形式 为 : 
pl=at+N-1 


(2) 若 “p2 一 af p2 十 三 N 一 1;”, 则 * p2 表示 元 素 aLN 一 1]。 
(3) “pl 二 a; p2 二 b; * pl 十 十 二 * p2 十 十 ;” 语 句 的 执行 结果 是 : 


a[0]=b[0]; pl=&a[ll]; p2= &b[1]; 


6. 指向 结构 的 指针 


(1) 指向 结构 的 指针 特点 : 指针 对 象 为 结构 体 类 型 。 
(2) 指向 结构 的 指针 定义 : 


struct 结构 名 * 变量 名 
(3) 引用 成 员 。 
(* 指针 变量 名 ). 成 员 名 


等 价 于 : 
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础 。 


指针 变量 名 -> 成 员 名 
例如 : 


struct student 
{ int num; 
int age; 
float score; 
} s,*p; 
p= &s; 
p->num= 10; 
p-> score=85.5; 


上 述 程 序 段 的 执行 过 程 如 图 1. 13 所 示 。 


s.num 10 

Ss.age | 
S.Score 85.5 
p 2000 


简化 为 : 
num age Score 
10 | sss 
访问 格式 ，p->num p->age p->score p 


图 1.13 指向 结构 的 指针 示意 图 


为 了 总 结 指针 、 结 构 体 类 型 的 使 用 , 现 通过 例 1. 15 的 程序 段 进行 综合 说 明 。 

例 1.15 综合 举例 。 

程序 本 身 无 实际 意义 , 仅 为 了 说 明 各 数据 类 型 的 使 用 方法 ,为 后 续 的 算法 描写 打下 基 
程序 执行 示意 图 如 图 1. 14 所 示 。 


struct object 


int data; 
struct object * next; 
}; // 定 义 一 个 结构 体 类 型 ,注意 其 next 成 员 是 指向 该 结构 体 类 型 的 指针 类 型 


#define NULL 0 
# define LEN sizeof(struct object) 
void main() 
. 
struct object x*p, *q, *ptr; 
// 定 义 指针 变量 , 分配 指针 变量 的 内 存单 元 ,但 此 时 指针 变量 无 确定 值 , 即 无 对 象 
p = (struct object * )malloc(LEN); 
// 动 态 产生 一 个 新 结 点 (结构 体 存储 单元 ) ,并 把 其 地 址 赋 给 指针 变量 p, 此 时 p 有 对 象 
// 目 前 的 对 象 是 新 产生 的 结 点 ,如 图 1.14 中 四 所 示 
p->data=5;  ”// 对 Pp 的 对 象 的 data 成 员 赋 值 , 按 int 类 型 操作 ,如 图 1.14 中 加 所 示 
q= (struct object x )malloc(LEN);  // 如 图 1.14 中 国 所 示 
q->data=10;  // 如 图 1.14 中 国 所 示 
p->next=q;  ”// 对 Pp 的 对 象 的 next 成 员 赋 值 为 q, 按 指针 类 型 操作 ,达到 两 个 结 点 的 链接 


// 注 意 : 此 时 是 对 p 的 next 成 员 赋值 ,而 P 自己 没有 修改 ,如 图 1.14 中 国 所 示 

q—-> next = NULL; 

// 对 q 的 对 象 的 next 成 员 赋 值 为 空 指针 ,表明 链接 的 结束 ,如 图 1.14 中 @ 所 示 

p->next—> data= 20; 

// 对 Pp 的 后 继 (next) 的 数据 (data) 修 改 ,此 时 即 是 对 q 的 数据 (data) 修 改 ,如 图 1.14 中 四 所 示 
ptr=p; //ptr 指向 p 的 结 点 ,如 图 1.14 中 国 所 示 

p=p->next; 


//p 指向 p 的 后继 ,指针 后 移 ,如 图 1.14 中 @ 所 示 , 此 时 , 原 结 点 只 能 通过 ptr 来 访问 


图 1.14 综合 举例 


1.4.4 C 语 言 的 函数 
1. 函数 与 C 语言 源 程序 的 结构 


1) 源 程序 结构 

C 语 言 是 模块 化 程序 设计 语言 , 即 函 数 式 语言 。 任 何 C 语言 源 程序 由 一 个 主 函 数 main() 
和 若干 个 自 定义 函数 组 成 ,程序 的 执行 总 是 从 main() 函 数 开 始 。 

函数 分 为 标准 库 函 数 和 用 户 自 定义 函数 两 类 。 

标准 库 函数 是 由 系统 预先 编写 的 一 系列 常用 函数 ,无 须 用 户 定义 ,也 不 必 在 程序 中 进行 
类 型 说 明 , 只 需 在 程序 前 包含 该 函数 原型 的 头 文件 即 可 。 

用 户 自 定义 函数 是 用 户 根 据 程序 设计 的 需要 而 设计 的 一 个 子 函数 ,一 次 定义 ,多 次 调 
用 ,达到 减少 重复 编写 程序 段 的 目的 。 

本 书 中 的 算法 都 是 以 自 定义 函数 的 形式 给 出 ,因此 ,关于 算法 描述 的 注意 细节 与 下 述 使 
用 自 定义 函数 的 要 点 相同 。 

2) 自 定义 函数 的 使 用 步 又 

根据 用 户 自 定义 函数 的 要 求 , 在 程序 中 先 要 定义 一 个 需要 完成 的 功能 子 函 数 , 然 后 在 主 
调 函 数 模块 中 对 被 调 函 数 进行 类 型 说 明 , 最 后 才能 调用 该 自 定义 函数 ,也 就 是 定义 ,说 明 、 调 
用 3 个 步骤 。 

例 1.16 两 个 字符 的 比较 。 

#include< stdio.h> 

char s_cmp(char x, char y); // 回 ,为 s_cmp() 函 数 说 明 

void main() 

{ 

char a= 'A',b= 'b',c; 
c=s_cmp(a,b); // 回 ,为 s_cmp() 函 数 调用 
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printf("max= %c",c); 


} 


char s_cmp(char x, char y) // 四 ,为 s_cmp() 函 数 定义 
if(x>y) 
return x; // 函 数 返回 值 
else 
return y; // 函 数 返回 值 


. 


其 中 ,四 为 函数 定义 , 即 子 函 数 的 设计 ; 四 为 函数 说 明 ; @ 为 函数 调用 。 一 般 自 定义 函数 都 
需 进行 函数 声明 (函数 原型 )、 函 数 定义 、 函 数 调用 这 3 部 分 工作 ,函数 说 明 在 下 列 情况 下 也 
可 省 略 。 

。 函数 的 值 (函数 的 返回 值 ) 是 整 型 或 字符 型 (系统 自动 按 整 型 说 明 )。 

。 如果 函 数 定义 在 调用 函数 之 前 ,可 以 不 必 加 以 说 明 。 


2. 函数 调用 


(1) 函数 调用 的 几 种 方式 。 
Q@ 函数 语句 : 把 函数 调用 作为 一 个 语句 ,不 要 求 函 数 返回 值 ,只 要 求 函数 完成 一 定 的 
操作 。 例 如 : 


printstar(); 


@ 函数 表达 式 : 函数 出 现在 一 个 表达 式 中 ,要 求 函数 返回 一 个 确定 的 值 ,用 于 参加 表 
达 式 的 运算 。 例 如 : 

c=2xmax(a,b); 

@ 函数 参数 : 函数 调用 作为 一 个 函数 的 实 参 。 例 如 : 

m= max(a, max(b, c)); 

(2) 函数 调用 的 执行 过 程 。 

在 运行 被 调用 函数 之 前 ,系统 完成 : 

Q@ 将 所 有 的 实在 参数 、 返 回 地 址 等 信息 传递 给 被 调用 函数 保存 。 

@ 为 被 调用 函数 的 局 部 变量 分 配 存 储 区 。 

@ 将 控制 转移 到 被 调用 函数 的 入 口 。 

(3) 函数 返回 的 执行 过 程 。 

从 被 调用 函数 返回 调用 函数 之 前 ,系统 完成 : 

保存 被 调用 函数 的 计算 结果 。 

@ 释放 被 调用 函数 的 数据 区 。 

@ 依照 被 调用 函数 保存 的 返回 地 址 将 控制 转移 到 调用 函数 。 


3. 参数 传递 
C 语言 的 参数 传递 是 按 值 传 递 的 。 即 形式 参数 发 生 改变 ,实际 参数 也 不 会 变 。 
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例 1.17 参数 传递 举例 。 


void main() 
{ 
int a,b; 
void swap( int x, int y); // 函 数 说 明 
printf("input a,b:\n"); 
scanf(" %d%d", &a,&b); 
证 (a<b) swap(a,b); // 函 数 调 用 
printf("a= $d,b= %d\n",a,b); 
} 
void swap( int x, int y) // 函 数 定义 
{ 
int t; 
t=xx= yy=t; 
printf("x= %$d,y= %d\n",x,y); 


input av b: 返回 地 址 


x=5,y=3 3 t | x 
a=3,b=5 & | | 
例 1.17 的 执行 过 程 如 图 1. 15 所 示 。 
函数 返回 值 的 方法 有 两 种 : 一 种 是 通过 函数 = t 
值 返回 ,但 通过 return 语句 只 能 返回 一 个 值 ; 另 一 
种 是 通过 函数 的 参数 返回 ,这 样 可 以 返回 多 个 值 ， main 
如 指针 类 型 和 数组 类 型 的 参数 。 图 1.15 例 1.17 的 执行 过 程 
例 1.18 函数 返回 值 举 例 。 


swap 


void main() 

{ 

int a,b; 

void swap(int *x,int x y); // 函 数 说 明 
printf("input a,b:\n"); 

scanf("% ds%d", &a, &b); 

证 (a<b) swap(&a, &b); // 函 数 调用 
printf("a= %d,b= % d\n",a,b); 

} 
void swap(int *x, int x*y) // 函 数 定义 
{ 

nk t> 

ne A i at 

Printf(" xx= 下 dy *y= Sd\n", *x, *y); 

} 


运行 结果 : 


input a, b: 
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四 坟 
¥xX=5, xy=3 
a=5,b=3 


例 1. 18 的 执行 过 程 如 图 1. 16 所 示 。 


返回 地 址 
x a 
2000 
a 3 2000 2000 x 2000 ~ 3 
b 5 2002 2002 y 
t 
main swap 


图 1.16 例 1.18 的 执行 过 程 


1.4.5 用 C 语 言 验证 算法 的 方法 


本 书 的 算法 主要 以 C 语言 的 自 定义 函数 形式 给 出 的 ,要 验证 算法 , 需 编写 一 个 完整 的 
源 程序 ,通过 调用 函数 来 实现 算法 的 功能 。 一 般 源 程序 的 结构 如 下 : 


文件 包含 预 处 理 

符号 常量 的 定义 

类 型 定义 // 确 定数 据 结构 

返回 类 型 自 定义 函数 名 (形式 参数 表 ) 。 // 自 定义 函数 的 定义 , 即 算法 
{ 


} 


void main() 


{ 


变量 定义 ; // 定 义 处 理 对 象 

建立 对 象 ; // 根 据 存储 类 型 ,给 变量 赋值 , 以 确定 具体 的 处 理 对 象 
调用 自 定义 函数 ; // 引 用 函数 对 处 理 对 象 进行 操作 , 实现 算法 的 功能 
打印 输出 ; // 给 出 结果 


lL 
例 1.19 有 一 个 单 链表 的 就 地 逆 置 算法 , 现 编写 一 个 完整 的 源 程序 验证 该 算法 。 


#include < stdio.h> 
#include <malloc.h> 
typedef int elemtype; /* 定义 元 素 类 型 */ 
typedef struct linknode 
{ 
elemtype data; 
struct linknode x next; 
}nodetype; /* 定义 结 点 类 型 ,确定 线性 表 的 链 式 存储 结构 * / 


nodetype * create() 


证 


} 


void disp(nodetype * h) 


{ 


} 


nodetype * invert(nodetype * h) 


// 建 立 一 个 不 带头 结 点 的 单 链表 ,通过 函数 的 值 返回 头 指针 , 表 尾 插入 法 


elemtype d; /x* d 表 示 输 入 元 素 的 值 */ 

nodetype * h= NULL, * s, * t; /*h 为 头 指针 ,t 为 指向 表 尾 结 点 的 指针 , s 指向 新 结 点 * / 
int i=1; /* 记录 结 点 的 位 序号 * / 
printf(" 建 立 一 个 单 链表 \n"); 

while (1) /* 循环 体 完成 新 结 点 的 插入 , 以 实现 链表 的 建立 * / 

{ 


printf(" 输 入 第 %d 节点 data 域 值 :", i); 
Scanf(" % d", &d); 


if (d== 0) break; /x* 以 0 表示 输入 结束 */ 
if (i==1) /* 建立 第 一 个 结 点 */ 
{ 


h= (nodetype * )malloc(sizeof(nodetype)); 
h-> data= d;h- > next = NULL;t = h; 

} 

else 

{ 
s= (nodetype * )malloc(sizeof(nodetype)); 
s->data=d;s—>next= NULL;t—>next=s; 


t=s; /* 七 始终 指向 生成 的 单 链表 的 最 后 一 个 结 点 * / 


计 + 二 
} 
return h; /* 返 回头 指针 */ 


nodetype *p=h; /*p 指 向 正在 处 理 的 结 点 */ 
printf(" 输 出 一 个 单 链表 :\n"); 
证 (p== NULL) printf(" 空 表 "); 
while (p!= NULL) 
{ 
printf("%5d",p—->data);p=p-> next; 
} 
printf("\n"); 


/* 就 地 逆 置 单 链表 * / 


nodetype *p, *q, *r; 
if (!h||!(h—>next)) 
{ 
printf(" 首 置 的 单 链表 至 少 有 2 个 结 点 \n"); 
return h; 
} 
else /x* 就 地 首 置 */ 
* 
p=h;q=p->next; 
while (q!= NULL) 
{ r=q->next; 


/* 遍历 显示 以 h 为 头 指针 的 单 链表 */ 
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q->next=p; 
p=-qq=r; 

} 

h—> next = NULL; 


h=p; 
return h; 
} 
} 
void main() 
{ 
nodetype * head; // 定 义 变量 head, 以 表示 处 理 的 单 链表 头 指针 
head = create( ); // 建 立 单 链 表 head 
disp(head) ; // 显 示 逆 置 前 的 单 链表 
head = invert(head) ; // 调 用 逆 置 函数 ,实现 逆 置 功能 
disp(head) ; // 显 示 逆 置 后 的 单 链表 


} 


(1.5 从 C 语言 到 C++ 语言 
wo 用 


C++ 语言 是 由 C 语言 扩充 而 来 ,是 C 语言 的 超 集 , 它 不 仅 保持 了 C 语言 的 功能 强 、 目 标 
代码 效率 高 和 可 移植 性 好 等 优点 ,而 且 还 支持 面向 对 象 的 程序 设计 方法 。 

本 节 将 介绍 C++ 的 面向 对 象 的 相关 概念 ,并 进行 一 些 类 的 定义 。 这 些 定义 被 保存 在 相 
关 的 头 文件 中 ,在 后 续 示 例 中 根据 需要 对 相关 的 头 文件 进行 了 引用 。 为 此 ,在 定义 的 同时 说 
明了 保存 该 类 的 头 文件 ,以 方便 读者 阅读 和 理解 。 

本 书 其 他 各 章 均 沿用 了 这 样 的 说 明 方式 。 


1.5.1 C++ 语言 的 类 和 抽象 数据 类 型 


抽象 数据 类 型 (ADT) 是 描述 数据 结构 的 一 种 理论 工具 。 一 种 数据 结构 被 视 为 一 个 抽 
象 数据 类 型 ,数据 结构 上 的 算法 视 为 抽象 数据 类 型 的 基本 操作 。 在 C++ 语言 中 ,用 类 (包括 
模板 类 ) 的 声明 来 表示 ADT, 用 类 的 实现 来 实现 ADT。C++ 语 言 中 实现 的 类 相当 于 数据 的 
存储 结构 及 其 在 存储 结构 上 实现 的 对 数据 的 操作 即 算法 。 类 由 公有 部 分 和 私有 部 分 组 成 ， 
每 个 部 分 可 包含 若干 数据 成 员 和 成 员 函 数 。 公 有 (public) 部 分 描述 用 户 使 用 类 的 界面 , 它 
使 用 户 不 必 了 解 对 象 的 内 部 细节 而 使 用 对 象 ; 私有 (private) 部 分 由 帮助 实现 数据 抽象 的 数 
据 和 内 部 操作 组 成 。 抽 象 数 据 类 型 与 C++ 语言 中 类 的 对 应 关系 如 表 1. 3 所 示 。 


表 1.3 抽象 数据 类 型 与 C++ 中 类 的 对 应 关系 


抽象 数据 类 型 对 应 类 
数据 对 象 二 一 一 一 > 数据 成 员 ( 属 性 ) 
基本 操作 二 -一 一 一 > 成 员 函 数 (方法 ) 


C++ 语 言 中 的 类 只 是 一 个 由 用 户 定义 的 普通 类 型 ,可 用 它 来 定义 变量 ( 即 对 象 或 类 的 实 
例 ) ,通过 操作 对 象 来 解决 实际 问题 。 对 每 一 种 抽象 数据 类 型 用 一 个 类 来 描述 ,在 具体 应 用 


中 ,用 对 象 来 存储 和 处 理 数据 。 数 据 结构 的 定义 为 对 象 的 属性 (或 数据 成 员 ) ,算法 的 定义 在 


对 象 中 称 为 方法 (或 成 员 函 数 )。 
为 了 创建 对 象 ,必须 首先 定义 类 ,定义 类 的 一 般 形 式 为 : 


class < 类 名 > 
{ 
public: 
< 公有 数据 和 函数 > 
protected: 
< 保护 数据 和 函数 > 
private: 
< 私有 数据 和 函数 > 
}; 


对 象 的 声明 形式 为 : 
< 类 名 > < 对 象 名 表 > 


为 了 说 明 ADT 在 C++ 语言 中 的 实现 , 例 1. 20 用 C++ 语言 中 的 类 来 实现 复数 ADT ,该 


类 的 定义 保存 在 文件 complex.h 中 。 复 数 ADT 的 描述 见 1. 1. 2 节 的 例 1. 8。 
例 1.20 复数 类 。 


class complex{ 
// 类 的 声明 
public: 
Complex( ); 


Complex(double r, double i); //r-— RealPart ; i—- ImaginPart 


double GetRealPart( ); 
double GetImaginPart(); 
void SetRealPart (double r); 
void SetImaginPart(double i); 
Complex& operator = (Complex& complex); 
Complex& operator + (Complex& complex); 
Complex& operator - (Complex& complex); 
Complexg& operator * (Complex& complex); 
Complex& operator/ (Complex& complex); 
friend ostream& operator <<(ostream& os, Complex& complex); 


// 友 元 函数 : 重 载 流 输入 流 输 出 


private: 
double mRealPart; // 实 部 
double mImaginPpart; // 虚 部 

}; 

// 类 的 实现 

Complex: :Complex( ) // 函 数 重 载 


{ 
mRealPart = 0; 
mImaginPart = 0; 
. 
Complex: :Complex( double r, double i) // 函 数 重 载 
mRealPart = r; 
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mImaginPart = i; 
double Complex: :GetRealPart( ) 
return mRealPart; 

} 
double Complex: :GetImaginPart() 
return mImaginPart; 

} 
void Complex: :SetRealPart (double r) 
mRealPart = r; 

} 
void Complex: :SetImaginPart(double i) 


mImaginPart = i; 


Complex& Complex: :operator = (Complex& complex) ”// 运 算 符 重 载 


mRealPart = complex.GetRealPart(); 
mImaginPart = complex.GetImaginPart(); 
return * this; 

} 

Complex& Complex: :operator + (Complex& complex)  ”// 运 算 符 重 载 

{ 
Complex * result = new Complex(); 
result ~ > SetRealPart(mRealPart + complex.GetRealPart()); 
result 一 > SetImaginPart(mImaginPart + complex.GetImaginPart()); 
return * result ; 

} 

Complex& Complex: :operator - (Complex& complex) ”// 运 算 符 重 载 

| 
Complex * result = new Complex(); 
result - > SetRealPart(mRealPart — complex.GetRealPart()); 
result ~ > SetImaginPart(mImaginPart — complex.GetImaginPart()); 
return * result; 

， 

Complex& Complex: :operator * (Complex& complex) ”// 运 算 符 重 载 

' 
Complex * result = new Complex(); 
result - > SetRealPart(mRealPart * complex.GetRealPart()); 
result — > SetImaginPart(mImaginPart * complex.GetImaginPart()); 
return * result; 

} 

Complex& Complex: :operator /(Complex& complex) // 运 算 符 重 载 

* 
Complex * result = new Complex(); 
result — > SetRealPart(mRealPart / complex. GetRealPart( )); 
result ~- > SetImaginPart(mImaginPart / complex. GetImaginPart()); 
return * result; 


} 


ostream& operator <<(ostream& os, Complex& complex) 


// 友 元 函数 : 重 载 <<, 将 复数 输出 到 输出 流 对 象 os 中 


{ 


double r = complex.GetRealPart(); 
double i = complex.GetImaginPart(); 


if(fabs(i) < 0.00001) 


return os << complex. GetRealPart(); 


else 


return os<<r<<((i>= 0)?"+":" 一")<< fabs(i)<<"i"; 


} 


在 实际 应 用 中 ,为 了 使 ADT 的 各 种 实现 类 都 有 一 致 的 操作 界面 (统一 的 接口 ), 常 常用 
一 个 抽象 模板 类 来 定义 ADT ,该 抽象 模板 类 中 的 成 员 函 数 为 虚 函 数 。ADT 的 所 有 实现 类 
都 将 作为 该 抽象 模板 类 的 派生 类 ,都 必须 重新 定义 抽象 模板 类 中 的 成 员 函 数 ,从 而 保证 实现 
ADT 的 各 个 派生 类 都 有 完全 一 致 的 用 户 界面 , 即 实现 了 “相同 界面 ,多 种 实现 ”的 理念 。 关 
于 ADT 与 C++ 语言 中 抽象 模板 类 、 派 生 类 的 示例 , 详 见 2. 1 节 的 ADT2. 1 线性 表 ADT 与 


2.4 节 的 例 2.1 和 例 2. 2。 


1.5.2 C++ 语言 验证 算法 的 方法 


一 种 数据 结构 被 视 为 一 个 抽象 数据 类 型 ,数据 结构 上 的 算法 被 视 为 抽象 数据 类 型 的 基 
本 操作 。 在 C++ 语言 中 ,用 类 (包括 模板 类 ) 的 声明 来 表示 ADT, 用 类 的 实现 来 实现 ADT， 
实现 的 类 相当 于 数据 的 存储 结构 及 其 在 存储 结构 上 实现 算法 。 

要 验证 算法 即 验证 类 的 方法 是 否 正 确 ,首先 要 将 类 的 声明 及 类 的 实现 存放 在 一 个 头 文 
件 中 ,然后 编写 验证 算法 的 源 程 序 (. cpp) ,其 结构 如 下 : 


文件 包含 预 处 理 
void main( ) 
{ 
变量 定义 ; 
建立 对 象 ; 
调用 对 象 的 成 员 函 数 ( 或 方法 ); 
打印 输出 ; 
} 


// 把 类 的 声明 和 实现 的 头 文件 嵌入 到 当前 源 程 序 中 


// 定 义 处 理 对 象 

// 给 变量 赋值 

// 引 用 方法 对 处 理 对 象 进行 操作 ,实现 算法 的 功能 
// 给 出 结果 


例如 ,为 了 验证 复数 类 的 算法 , 需 编 写 程序 (存放 在 文件 Complex. cpp 中 ) 来 运行 验证 。 


例 1.21 复数 类 的 验证 。 


# include "Complex. h" 

void main() 
Complex a(3,6); 
Complex b(2,3); 
Complex c; 
cout <<"a= "<<a<<endl; 
cout <<"b = "<<b<<endl; 
安 二 


// 把 复数 类 头 文件 嵌入 到 本 程序 中 


// 定 义 并 建立 对 象 a 
// 定 义 并 建立 对 象 b 
// 定 义 对 象 c 


// 调 用 " + "成 员 函 数 
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cout <<"a+b= "<<c <<endl; // 调 用 输出 成 员 函 数 
ce 三 a=b; 

cout <<"a- b= "<<c <<endl; 

c= axb; 

cout <<"axb= "<<c <<endl; 

c= a/b; 

cout <<"a/b= "<<c << endl; 


} 


1.5.3 ”C++ 语言 与 C 语言 程序 的 区 别 


与 C 语 言 程序 相同 ,一 个 C++ 诸 言 程序 可 以 由 多 个 函数 构成 ,每 个 程序 都 从 主 函 数 
main() 开 始 运 行 ,从 主 函 数 返 回 时 结束 运行 。 组 成 程序 的 语句 主要 包括 声明 语句 和 执行 语 
句 。 声 明 语句 用 于 声明 变量 和 函数 。 执 行 语句 包括 赋值 语句 .表达 式 语句 、 函 数 调用 语句 和 
流程 控制 语句 等 ,它们 写 在 一 个 函数 中 (包括 主 函 数 )。 

C++ 语言 与 C 语言 程序 不 同 之 处 如 下 。 

(1) C 语言 源 程序 文件 的 扩展 名 为 c, 而 C++ 语言 源 程序 文件 的 扩展 名 为 cpp。 

(2) C 语言 注释 使 用 符号 /* 和 * /, 表 示 符 号 /* 和 * /之 间 的 内 容 都 是 注释 ; C++ 语言 
除了 支持 这 种 注释 ,还 提供 了 一 个 双 斜 线 // 注 释 符 , 表 示 // 之 后 的 本 行内 容 是 注释 ,注释 在 
行 尾 自动 结束 。 

(3) 当 函 数 定义 放 在 函数 调用 之 后 时 ,C 语言 程序 函数 原形 (声明 ) 有 时 可 省 略 ,而 C++ 请 
言 程序 函数 原形 必 不 可 少 。C++ 语 言 还 要 求 函 数 所 有 参数 在 函数 原形 的 圆 括 号 中 声明 。 

(4) 在 C 语 言 中 .函数 和 语句 块 ( 花 括 号 {) 之 间 的 代码 ) 的 所 有 变量 声明 语句 必须 放 在 
所 有 执行 语句 前 。 而 C++ 语言 中 变量 声明 语句 不 要 求 放 在 函数 和 语句 块 的 开始 位 置 ,可 以 
把 变量 声明 放 在 首次 使 用 变量 的 附近 位 置 , 这 样 可 提高 程序 的 可 读 性 。 

(5) C 语言 的 内 存 分 配 和 释放 函数 为 malloc() 和 free() ,而 C++ 语言 用 new 和 delete 
运算 符 。 

(6) C 语言 程序 所 包含 的 标准 输入 输出 的 头 文件 是 stdio. h, 输 入 输出 通常 通过 调用 函 
数 (如 printf() 、scanf()) 来 完成 ; 而 C++ 语言 程序 可 以 包含 标准 输入 输出 的 头 文件 
iostream. h, 输 入 输出 可 以 通过 使 用 标准 输入 输出 流 对 象 (如 cin、cout) 来 完成 ,利用 优 流 提 
取 运 算 符 或 利用 冬 流 插入 运算 符 , 分 别 将 数据 对 象 从 输入 流 提 取出 来 或 插入 到 输出 流 , 从 而 
完成 数据 的 输入 和 输出 。 


1.5.4 C++ 语言 的 重要 特性 


要 在 C 语言 基础 上 ,尽快 熟悉 C++ 语言 ,以 便 描述 数据 结构 的 算法 ,还 需要 了 解 一 些 
C++ 语言 的 特性 。 


1. 引用 


所 谓 引用 就 是 给 对 象 起 一 个 别名 ,使 对 象 和 它 的 引用 共用 一 个 地 址 ,因而 无 论 对 谁 进行 
修改 都 是 对 同一 地 址 的 修改 ,都 会 使 对 象 和 它 的 引用 总 是 具有 相同 的 值 。 


1) 引用 的 定义 格式 
引用 的 建立 格式 如 下 : 


< 类 型 说 明 符 > & < 引用 名 > = < 对 象 名 > 

例如 : 

int a; 

int &ta= ai 
其 中 ,ta 是 一 个 引用 名 , 即 ta 是 a 的 别名 ,要 求 a 已 经 声明 或 定义 。 

2) 引用 的 主要 用 途 

引用 的 主要 用 途 是 用 作 函 数 参数 和 函数 的 返回 值 。 使 用 引用 作为 函数 的 形 参 时 ,调用 
函数 的 实 参 要 用 变量 名 。 实 参 传 递 给 形 参 ,相当 于 在 被 调 函 数 中 使 用 了 实 参 的 别名 。 在 被 
调 函 数 中 对 形 参 的 操作 ,实质 是 对 实 参 的 直接 操作 , 即 数据 的 传递 是 双向 的 。 

例 1.22 将 引用 作为 参数 ,编写 函数 ,交换 两 个 对 象 的 值 (与 1. 4.4 节 的 例 1. 17 和 
例 1.18 对 应 )。 


# include < iostream > 
void swap(int g&x, int &y); 
void main() 
{ 
int a,b; 
printf("input a,b:\n"); 
scanf("% dg%d",&a,&b); 
if (a<b) swap(a,b); // 函 数 调用 


printf("a= $d,b= %d\n",a,b); 


} 
void swap( int &x, int &y) // 函 数 定义 


{ 
int t; 
t=x;x= yy= t; 
printf("x= %d,y= % d\n",x,y); 


2. this 指针 


同一 类 的 各 个 对 象 创建 后 ,都 在 类 中 产生 了 自己 数据 成 员 的 副本 ,但 为 了 节省 存储 空 
间 ,每 个 类 的 成 员 函 数 只 有 一 个 副本 ,成员 函数 由 各 个 对 象 调用 。C++ 语 言 为 成 员 函 数 提供 
了 一 个 称 为 this 的 指针 , 当 创建 一 个 对 象 时 ,this 指针 就 初始 化 指向 该 对 象 。 当 某 个 对 象 调 
用 一 个 成 员 函 数 时 ,this 指针 将 作为 一 个 变量 自动 传 给 该 函数 。 不 同 的 对 象 调用 同一 个 成 
员 函 数 时 ,编译 器 根据 this 指针 来 确定 应 该 引用 哪个 对 象 的 数据 成 员 。 
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this 指针 是 由 C++ 语言 编译 器 自动 产生 且 较 常用 的 一 个 隐 含 对 象 指针 , 它 不 能 被 显 式 
声明 。this 指针 是 一 个 局 部 于 某 个 对 象 的 局 部 量 , 它 是 一 个 常量 。 
例 1.23 this 指针 的 显 式 使 用 。 


# include < iostream.h> 
class point 
{ 
public: 
point( int x, int Y){X=xiY=Yi} 
point(){X= 0;Y= 0;} 
void copy(point &obj); 
void display(); 
private: 
int X,Y; 


’ 
void point: :copy(point &obj) 


if (this!= &obj) //this 指针 的 显 式 使 用 , 避免 无 意义 的 更 新 , 如 obj2. copy(obj2); 
x this = obj; // 若 改 为 this = gobj; 将 出 现 错误 ,不 能 给 常量 this 赋值 


void point: :display() 


cout <<X<<" "; 
cout <<Y<< endl; 


void main() 


point obj1(10, 20), obj2; 
obj2. copy(obj1); 

objl. display(); 

obj2. display(); 


3. 类 的 友 元 


友 元 是 C++ 语言 提供 给 外 部 的 类 或 函数 访问 类 的 私有 成 员 和 保护 成 员 的 一 种 途径 , 它 
提供 在 不 同类 的 成 员 函 数 之 间 、 类 的 成 员 函 数 与 一 般 函 数 之 间 进 行 数据 共享 的 机 制 。 友 元 
可 以 是 一 个 函数 , 称 为 友 元 函数 ,也 可 以 是 一 个 类 , 称 为 友 元 类 。 

在 类 里 声明 一 个 普通 函数 ,加 上 关键 字 friend, 就 成 了 该 类 的 友 元 函数 , 它 可 以 访问 该 
类 的 一 切 成 员 。 其 定义 格式 为 : 


friend < 类 型 说 明 符 > < 友 元 函数 名 >(< 参 数 表 >) 


友 元 函数 声明 的 位 置 可 在 类 的 任何 地 方 ,意义 都 完全 一 样 。 友 元 函数 的 实现 则 在 类 的 
外 部 ,一 般 与 类 的 成 员 函 数 定义 放 在 一 起 。 友 元 函数 的 实例 见 1. 5. 1 节 的 例 1. 20 复数 类 。 


友 元 类 的 声明 格式 为 : 
friend < 类 名 >; 


友 元 类 的 示例 见 2. 5. 3 节 的 例 2. 9 结 点 类 和 单 链表 类 。 
4. 继承 与 派生 


根据 一 个 类 创建 一 个 新 类 的 过 程 称 为 继承 ,派生 新 类 的 类 称 为 基 类 ,而 派生 出 来 的 新 类 
称 为 派生 类 。 派 生 类 自动 具有 基 类 的 成 员 ,根据 需要 还 可 以 增加 新 成 员 。 当 从 基 类 派生 出 
新 类 时 ,可 以 对 派生 类 做 如 下 改变 。 

(1) 增加 新 的 数据 成 员 。 

(2) 增加 新 的 成 员 函 数 。 

(3) 重新 定义 已 有 的 成 员 函 数 。 

(4) 改变 现 有 数据 成 员 的 属性 。 

从 一 个 基 类 派生 的 继承 被 称 为 单 继承 , 从 多 个 基 类 派生 的 继承 被 称 为 多 继承 。 单 继承 
的 一 个 形式 如 下 : 

class < 派生 类 名 >:< 继 承 方 式 >< 基 类 名 > 

人 

< 公有 数据 和 函数 > 
protected: 

< 保护 数据 和 函数 > 
private: 


< 私有 数据 和 函数 > 


}; 

< 继承 方式 > 有 如 下 3 种 。 

(1) public: 表示 公有 继承 方式 。 

(2) protected: 表示 保护 继承 方式 。 

(3) private: 表示 私有 继承 方式 ,默认 情况 下 为 此 继承 方式 。 

在 这 3 种 继承 方式 下 ,派生 类 中 基 类 成 员 的 访问 权限 如 表 1.4 所 示 。 在 实际 开发 程序 
过 程 中 ,一 般 都 采用 公有 继承 方式 。 

表 1.4 3 种 继承 方式 下 派生 类 中 基 类 成 员 的 访问 权限 


继承 方式 | 基 类 成 员 | 在 派生 类 中 访问 权限 | 派生 类 内 部 模块 访问 性 派生 类 对 象 访 问 性 
公有 成 员 公有 的 可 以 访问 可 以 访问 
公有 继承 | 保护 成 员 保护 的 可 以 访问 不 可 访问 
私有 成 员 不 可 访问 不 可 访问 不 可 访问 
公有 成 员 私有 成 员 可 以 访问 不 可 访问 
私有 继承 | 保护 成 员 私有 成 员 可 以 访问 不 可 访问 
私有 成 员 不 可 访问 不 可 访问 不 可 访问 
公有 成 员 保护 的 可 以 访问 不 可 访问 
保护 继承 | 保护 成 员 保护 的 可 以 访问 不 可 访问 
私有 成 员 不 可 访问 不 可 访问 不 可 访问 
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任何 类 的 访问 属性 如 下 。 

(1) private 中 的 成 员 : 只 有 本 类 中 的 任何 成 员 可 以 调用 、 操 作 它 。 

(2) protected 中 的 成 员 : 只 有 自己 类 中 和 它 的 派生 类 中 的 任何 成 员 可 以 调用 .操作 它 。 
(3) public 中 的 成 员 : 在 整个 程序 中 都 可 以 调用 它 。 

基 类 派生 类 的 示例 详 见 2. 5 节 的 例 2.5 和 例 2. 6。 


5. 虚 函 数 


虚 函 数 是 一 个 成 员 函 数 ,该 成 员 函 数 在 基 类 内 部 声明 并 且 被 派生 类 重新 定义 。 为 了 创 
建 虚 函 数 ,应 在 基 类 中 该 函数 声明 的 前 面 加 上 关键 字 virtual。 虚 函数 的 定义 格式 如 下 : 

Virtual < 返回 值 类 型 >< 函 数 名 >(< 形 式 参 数 表 >) 

{ 

< 函数 体 > 

} 
其 中 ,virtual 是 关键 字 , 被 该 关键 字 声 明 的 函数 为 虚 函 数 。 

如 果 某 类 中 一 个 成 员 函 数 被 声明 为 虚 函 数 ,这 便 意味 着 该 成 员 函 数 在 派生 类 中 可 能 存 
在 不 同 的 实现 方式 。 当 继承 包含 虚 函 数 的 类 时 ,派生 类 将 重新 定义 该 虚 函 数 以 符合 自身 的 
需要 。 从 本 质 上 讲 , 虚 函数 实现 了 “相同 界面 ,多 种 实现 ”的 理念 。 

如 果 不 能 在 基 类 中 给 出 有 意义 的 虚 函 数 的 实现 ,但 又 必须 让 基 类 为 派生 类 提供 一 个 公 
共 界 面 函 数 , 这 时 可 以 将 它 声明 为 纯 虚 函数 , 它 的 实现 留 给 派生 类 来 做 。 说 明 纯 虚 函 数 的 一 
般 形式 如 下 : 


virtual < 返回 值 类 型 >< 函 数 名 >(< 形 式 参 数 表 >) = 0; 


纯 虚 函数 的 定义 是 在 虚 函 数 定义 的 基础 上 ,再 让 函数 等 于 0 即 可 。 这 只 是 一 种 表示 纯 
虚 函 数 的 形式 ,并 不 是 说 它 的 返回 值 是 0。 

一 个 类 可 以 说 明 多 个 纯 虚 函数 ,包含 有 纯 虚 函数 的 类 被 称 为 抽象 类 。 一 个 抽象 类 只 能 
作为 基 类 来 派生 新 类 ,不 能 说 明 抽象 类 的 对 象 ,也 不 能 用 作 参 数 类 型 .函数 返回 类 型 或 显 式 
类 型 转换 。 抽 象 类 用 于 描述 一 组 派生 类 的 共同 的 操作 接口 (界面 ), 它 用 作 基 类 ,其 派生 类 必 
须 覆 盖 纯 虚 函 数 , 或 在 该 派生 类 中 仍 将 它 说 明 为 纯 虚 函 数 ,否则 编译 器 将 给 出 错误 信息 。 如 
果 派 生 类 中 覆盖 了 所 有 的 纯 虚 函数 , 则 该 派生 类 不 再 是 抽象 类 。 

抽象 类 与 派生 类 的 示例 详 见 2.5 节 。 


6. 重 载 


C++ 语言 重 载 分 为 函数 重 载 和 运算 符 重 载 ,通过 重 载 机 制 可 以 对 一 个 函数 名 (或 运算 
符 ) 定 义 多 个 函数 (或 运算 功能 ) ,只 不 过 要 求 这 些 函数 的 参数 (或 参加 运算 的 操作 数 ) 的 类 型 
或 个 数 有 所 不 同 。 

1) 函数 重 载 

重 载 函数 通常 用 来 对 具有 相似 行为 而 数据 类 型 不 同 的 操作 提供 一 个 通用 的 名 称 ,编译 
系统 将 根据 函数 参数 的 类 型 和 个 数 来 判断 使 用 哪 一 个 函数 。 类 的 成 员 函 数 可 以 重 载 ,特别 
是 构造 函数 的 重 载 为 C++ 语言 程序 设计 带 来 很 大 的 灵活 性 。 


2) 运算 符 重 载 
重 载 一 个 运算 符 , 就 是 编写 一 个 运算 符 函数 。 重 载运 算 符 的 一 般 形式 如 下 : 
< 数据 类 型 > operator < 运算 符 >(< 形 式 参 数 表 >); 


其 中 ,数据 类 型 表示 运算 结果 的 类 型 ,运算 符 是 要 重 载 的 运算 符 , 形 式 参数 表 代表 参加 运算 
的 操作 数 。 
关于 重 载 的 示例 详 见 1.5 节 中 的 例 1. 20。 


7. 模板 


模板 把 函数 或 类 要 处 理 的 数据 类 型 参数 化 。C++ 语 言 中 ,模板 分 为 函数 模板 和 类 模板 。 
模板 并 非 是 一 个 实 实在 在 的 函数 或 类 ,仅仅 是 函数 或 类 的 描述 ,模板 运算 对 象 的 类 型 是 一 种 
参数 化 的 类 型 。 模 板 的 类 型 参数 由 调用 实际 参数 的 具体 数据 类 型 替换 ,并 由 编译 器 生成 一 
段 真正 可 以 运行 的 代码 ,这 个 过 程 称 为 实例 化 。 

1) 函数 模板 

带 类 型 参数 的 函数 称 为 函数 模板 。 利 用 函数 模板 可 以 将 数据 类 型 作为 函数 参数 ,从 而 
定义 一 系列 相关 重 载 函数 的 模板 。 函 数 模 板 的 定义 格式 如 下 : 

template < 模板 参数 表 > 

< 返回 值 类 型 >< 函 数 名 >(< 形 式 参 数 表 >) 

{ 

< 函数 体 > 

} 
其 中 ,关键 字 template 是 定义 模板 的 关键 字 ,< 模 板 参 数 表 > 中 包含 一 个 或 多 个 用 逗号 分 开 
的 模板 参数 项 ,每 一 项 由 保留 字 class 或 typename 开始 ,后 跟 用 户 命名 的 标识 符 , 此 标识 符 
为 模板 参数 ,表示 数据 类 型 。 函 数 模板 中 可 以 利用 这 些 模板 参数 定义 函数 返回 值 类 型 .参数 
类 型 和 函数 体 中 的 变量 类 型 ,可 以 在 函数 的 任何 地 方 使 用 。 

2) 类 模板 

带 类 型 参数 的 类 称 为 类 模板 。 类 是 对 一 组 对 象 的 公共 性 质 的 抽象 ,而 类 模板 则 是 对 不 
同类 的 公共 性 质 的 抽象 ,因此 类 模板 是 属于 更 高 层次 的 抽象 。 类 模板 的 定义 格式 如 下 : 

template < 模板 参数 表 > 

class < 类 模板 名 > 

{ 

< 类 成 员 声明 > 

} 
其 中 ,< 模板 参数 表 > 中 包含 一 个 或 多 个 用 逗号 分 开 的 类 型 ,参数 项 可 以 包含 基本 数据 类 型 ， 
也 可 以 包含 类 类 型 ; 若是 类 类 型 , 则 须 加 关键 字 前 级 class 或 typename。 类 模板 中 的 成 员 
函数 和 重 载 的 运算 符 必 须 为 函数 模板 。 它 们 的 定义 可 以 放 在 类 模板 的 定义 体 中 ,与 类 中 的 
成 员 函 数 的 定义 方法 一 致 ; 也 可 以 放 在 类 模板 的 外 部 , 则 要 采用 以 下 形式 : 

template < 模板 参数 表 > 

< 返回 值 类 型 > < 类 模板 名 >< 类 型 名 表 >: :< 函数 名 >(< 形 式 参 数 表 >) 

{ 
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< 类 成 员 声 明 > 
} 


其 中 ,< 类 模板 名 > 即 是 类 模板 中 定义 的 名 称 ,< 类 型 名 表 > 即 是 类 模板 定义 中 的 类 型 形式 参 
数 表 中 的 参数 名 。 

函数 模板 的 实例 化 是 由 编译 器 在 处 理 函 数 调用 时 自动 完成 的 ,而 类 模板 的 实例 化 必须 
由 程序 员 在 程序 中 显 式 地 指定 。 当 类 模板 实例 化 为 模板 类 时 ,类 模板 中 的 成 员 函 数 同 时 实 
例 化 为 模板 函数 。 由 类 模板 经 实例 化 而 生成 的 具体 类 称 为 模板 类 。 定 义 模板 类 对 象 的 格 
式 为 : 


< 类 模板 名 >< 类 型 实 参 表 >< 对 象 名 >[ (< 实 参 表 >) ] 


@ 题 1 


1. 试 编写 算法 , 自 大 到 小 依次 输出 顺序 读 入 的 3 个 整数 的 值 。 
2. 试 编写 算法 ,计算 i1 x* 2i 的 值 并 存 人 数组 a[L sizej 的 第 i 一 1 个 分 量 中 (i 二 1,2,…， 
n)。 假 设计 算 机 中 允许 的 整数 最 大 值 为 max。 
3. 设 n 为 正 整 数 。 试 确定 下 列 各 程序 段 中 前 阜 以 记号 # 的 语句 的 频 度 ( 次 数 ) 和 ( 渐 
近 ) 时 间 复 杂 度 。 
(1) i=1;k=0; 
while (i<=n-1) { 
# kK+=10x i; 
4 
} 
(2) i=1;k=0; 
dof 
井 Kk+=10 关 ii 
ineteaaas 
(3) i=1;k=0; 
while (i<=n-1){ 
时 二 本 
# k+=10x i; 


(4) k=0; 

for (i=1; i<=n; i++){ 
for (j=i;j<=n;j++) 
4 


(5) i=1;j=0; 
while (i+j<=n){ 
(> 
else it+; 


(6) for(i=1; i<=n; i++) 
or (jy J<u i js} 
for (k=1; k<=j; k++) 
提 x++; 


全 机 练习 1 


1. 从 文件 中 输入 10 个 整数 ,将 其 中 最 小 的 数 与 第 一 个 数 对 换 , 把 最 大 的 数 与 最 后 一 个 
数 对 换 。 编 写 3 个 自 定义 函数 : 从 文件 中 输入 10 个 数 .数据 处 理 、 文 件 输出 10 个 数 , 并 编 
写 主 函 数 实现 验证 功能 。 

2. 设计 一 个 可 进行 复数 运算 的 演示 程序 。 要 求实 现下 列 6 种 基本 运算 : 

(1) 由 输入 的 实 部 和 虚 部 生成 一 个 复数 ; 

(2) 两 个 复数 求 和 ; 

(3) 两 个 复数 求 差 ; 

(4) 两 个 复数 求 积 ; 

(5) 从 已 知 复数 中 分 离 出 实 部 ; 

(6) 从 已 知 复数 中 分 离 出 虚 部 。 

运算 结果 以 相应 的 复数 或 实数 的 表示 形式 显示 。 


本 章 学 习 要 点 

(1) 了 解 顺序 表 、 链 表 的 概念 、 含 义 `. 区 别 。 

(2) 熟练 掌握 线性 表 在 顺序 存储 结构 和 和 链 式 存储 结构 上 的 描述 方法 。 

(3) 熟练 掌握 线性 表 在 顺序 存储 结构 上 实现 查找 .插入 和 删除 的 算法 。 

(4) 熟练 掌握 在 各 种 链表 中 实现 线性 表 操 作 的 基本 方法 ,能 在 实际 应 用 中 选用 适当 的 
链表 结构 。 

(5) 能 够 从 时 间 和 空间 复杂 度 的 角度 综合 比较 线性 表 两 种 存储 结构 的 不 同 特点 及 其 适 
用 场合 。 

从 本 章 开 始 讨论 的 线性 表 、 栈 .队列 和 串 的 逻辑 结构 都 是 线性 结构 ,其 中 ,线性 表 是 最 简 
单 . 最 常用 的 一 种 数据 结构 ,是 实现 其 他 数据 结构 的 基础 。 线 性 表 主 要 的 物理 存储 结构 有 两 
种 : 顺序 存储 结构 和 链 式 存储 结构 。 用 顺序 存储 结构 存放 的 线性 表 称 为 顺序 表 , 用 链 式 存 
储 结构 存放 的 线性 表 称 为 线性 链表 。 


@.1 线性 表 的 逻辑 结构 


2.1.1 线性 表 的 定义 


线性 表 (linear list) 是 n(n 三 0) 个 具有 相同 特性 的 数据 元 素 的 有 限 序列 。 其 中 ,n 表示 
线性 表 的 长 度 , 即 数据 元 素 的 个 数 。n 二 0 时 表 为 空 表 ,n 二 0 时 表 通 常 记 为 (41 ,as，…,a;， 
av ) 。ai 表示 第 一 个 数据 元 素 ,a, 表示 最 后 一 个 数据 元 素 ,a; 是 第 i 个 数据 元 素 。 除 aj 之 
外 , 表 中 的 每 个 数据 元 素 a; 均 有 了 唯一 的 前 趋 a;_1 ; 除 a, 之 外 , 表 中 每 个 数据 元 素 a; 均 有 唯 
一 的 后 继 ai+i 。 

可 见 ,数据 元 素 在 线性 表 中 的 位 置 取 决 于 它 自 身 的 序号 , 即 数据 元 素 在 位 置 上 是 有 序 
的 ,元素 之 间 存 在 一 对 一 的 关系 。 所 以 .线性 表 的 逻辑 结构 是 线性 结构 。 对 应 的 逻辑 结构 示 
意图 如 图 2.1 所 示 。 


图 2.1 线性 表 的 逻辑 结构 示意 图 


每 个 数据 元 素 的 具体 含义 在 不 同 的 线性 表 中 各 不 相同 , 它 可 以 是 一 个 数 ,或 一 个 符号 ， 
也 可 以 是 一 个 记录 ,甚至 是 其 他 更 复杂 的 信息 。 
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如 26 个 英文 字母 组 成 的 (A,B,C,D,…:,Z) 是 一 个 线性 表 ,线性 表 长 度 为 25 。A 是 第 一 
个 数据 元 素 ,Z 是 最 后 一 个 数据 元 素 ,A 是 B 的 直接 前 驱 ,B 是 A 的 直接 后 继 。 

又 如 表 2. 1 所 示 的 学 生成 绩 表 也 是 一 个 线性 表 , 其 中 数据 元 素 是 每 一 个 学 生 所 对 应 的 
一 行 信息 ,包括 学 号 、 姓 名、 成 绩 共 3 个 数据 项 。 线 性 表 中 数据 元 素 ( 结 点 ) 的 个 数 即 学 生 


人 数 。 
表 2.1 学 生成 绩 表 
学 号 姓 名 成 ” 绩 
1 李 诚 成 85 
2 王 佳 琪 76 
3 张 贤 文 83 
35 赵 晓 飞 95 


2.1.2 线性 表 的 运算 


对 线性 表 可 进行 的 运算 种 类 繁多 ,在 实际 应 用 中 , 当 线性 表 作 为 一 个 操作 对 象 时 ,所 需 


进行 的 操作 种 类 不 一 定 相同 ,不 同 的 操作 集合 将 构成 不 同 的 抽象 数据 类 型 。 
线性 表 上 基本 的 运算 如 下 。 
(1) 初始 化 线性 表 。 
(2) 判断 表 是 否 为 空 。 
(3) 求 线性 表 的 长 度 。 
(4) 读 取 线性 表 中 第 i 个 元 素 。 
(5) 查找 满足 给 定 条 件 的 数据 元 素 。 
(6) 在 线性 表 的 第 i 个 位 置 之 前 插入 一 个 新 的 数据 元 素 。 
(7) 删除 线性 表 中 的 第 i 个 数据 元 素 。 
(8) 表 置 空 。 


(9) 按 一 个 或 多 个 数据 项 值 的 递增 或 递减 顺序 重新 排列 线性 表 中 的 数据 元 素 。 
利用 以 上 运算 可 以 实现 线性 表 的 其 他 运算 。 如 将 两 个 线性 表 合 并 成 一 个 线性 表 , 或 将 
一 个 线性 表 拆 分 成 多 个 线性 表 等 运算 。 在 实际 应 用 中 ,可 根据 不 同 的 要 求 选择 适当 的 基本 


运算 解决 具体 问题 。 


在 已 知 线性 表 的 逻辑 结构 和 运算 后 就 可 以 定义 线性 表 的 抽象 数据 类 型 。ADT2. 1 是 线 


性 表 的 抽象 数据 类 型 描述 ,其 中 只 包含 最 基本 的 线性 表 运算 。 
ADT2. 1 线性 表 ADT 
ADT list{ 
数据 对 象 : 
卫 一 {ailaiE 元 素 集合 导 一 1,2,… ,n,n 之 0} 
数据 关系 : 
Ri={(aiisai) Nai 1sai: ED,i=2,.,n} 
基本 操作 : 


41 


42 


Ae 
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creat() : 创建 一 个 空 线性 表 。 

destroy() : 撤销 一 个 线性 表 。 

isempty() : 若 线性 表 空 , 则 返回 1; 否则 返回 0。 

length() : 返回 线性 表 中 元 素 个 数 。 

find(i,&x): 在 x 中 返回 线性 表 中 第 i 个 位 置 的 元 素 a;。 若 不 存在 , 则 返回 0, 否 则 返 
回 1。 

search(x): 若 x 不 在 表 中 , 则 返回 0, 和 否则 返回 x 在 表 中 的 位 序号 。 

insert(i,x) : 在 线性 表 的 第 i 个 位 置 之 前 插入 一 个 新 的 数据 元 素 x。 若 搬 人 成 功 , 则 返 
回 1 ,否则 返回 0。 

delete(i : 删除 线性 表 中 的 第 i 个 数据 元 素 a;。 若 删除 成 功 , 则 返回 1 ,否则 返回 0。 

update(i,x) : 将 元 素 a; 的 值 修改 为 x。 若 修改 成 功 , 则 返回 1 ,否则 返回 0。 

output(out) : 将 线性 表 送 至 输出 流 。 

}ADT list 


&.2 线性 表 的 顺序 存储 结构 一 一 顺序 表 


2.2.1 顺序 表 

在 计算 机 中 ,用 来 存储 线性 表 的 最 简单 .最 常用 的 方式 是 : 在 内 存 中 开辟 一 段 连续 的 存 
储 空间 ,用 一 组 连续 的 存储 单元 依次 存放 数据 元 存储 地 址 元 素 序 号 
素 。 这 种 存储 方式 叫 作 线性 表 的 顺序 存储 结构 ， 上 加 1 
简称 顺序 表 (sequence list) ,如 图 2.2 所 示 。 . 

顺序 存储 结构 的 特点 是 : 在 逻辑 上 相 邻 的 ("1) a i 
数据 元 素 , 它 们 的 物理 位 置 也 是 邻接 的 。 即 线性 ”+01) 页 7 
关系 利用 物理 上 的 相 邻 关系 来 体现 。 如 表 中 相 


邻 的 元 素 a; 与 ci+; 在 计算 机 内 的 存储 位 置 也 ”图 2.2 线性 表 的 顺序 存储 结构 示意 图 
相 邻 。 

由 于 线性 表 中 数据 元 素 具 有 相同 的 特性 ,所 以 很 容易 确定 表 中 第 i 个 元 素 的 存储 地 址 ， 
若 线 性 表 的 每 个 元 素 占用 m 个 存储 单元 ,并 以 所 占 的 第 一 个 存储 单元 的 存储 地 址 作为 数据 
元 素 的 存储 位 置 , 则 表 中 第 i 个 数据 元 素 的 存储 位 置 是 : 

LOC(a;) =LOC(a) + (i—D*m 《人 下 

其 中 ,LOC(a,) 是 线性 表 的 第 一 个 数据 元 素 ai 的 存储 位 置 .通常 称 为 线性 表 的 起 始 位 置 或 
基地 址 。 

显然 ,只 要 确定 了 线性 表 的 基地 址 LOC(ai ) 和 一 个 数据 元 素 占 用 的 存储 单元 的 大 小 
m ,线性 表 中 任 一 元 素 的 存储 地 址 都 可 以 根据 式 (2.1) 计 算出 来 。 这 样 就 可 以 随机 存 取 顺序 
表 中 任意 一 个 元 素 ,因此 线性 表 的 顺序 存储 结构 是 一 种 随机 存 取 的 存储 结构 。 

顺序 存储 结构 可 用 C 语言 的 一 维 数组 来 实现 。 一 个 数组 元 素 存 放 一 个 数据 元 素 ,数据 
元 素 的 存储 位 置 可 以 用 数组 元 素 的 下 标 来 表示 ,数组 下 标 从 0 开始 ,数组 的 元 素 个 数 就 是 线 
性 表 的 长 度 。 对 顺序 表 的 描述 如 下 : 
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# define Maxsize maxlen //maxlen 表示 线性 表 可 能 的 最 大 数据 元 素数 目 

typedef int elemtype; //elemtype 表示 数据 元 素 类 型 ,此 处 定义 为 int 

typedef struct 

{elemtype v[Maxsize]; // 存 放 线性 表 元 素 的 数组 ,关系 隐 含 

int len; // 表 示 线 性 表 的 长 度 

}sqlist; //sqlist 是 数据 类 型 ,此 处 表示 线性 表 的 顺序 存储 结构 

在 上 面 的 描述 中 ,线性 表 的 最 大 可 能 长 度 定义 为 Maxsize; elemtype 表示 数据 元 素 的 
类 型 ,其 具体 的 类 型 根据 不 同 的 问题 来 定义 ,如 整 型 . 实 型 .字符 型 等 。 顺 序 表 由 数组 v 和 变 
量 len 两 个 数据 项 组 成 ,其 中 ,一 维 数组 v 用 于 实现 线性 表 的 顺序 存储 ,下 标 从 0 到 len 一 1， 
线性 表 的 第 ; 个 元 素 ( 即 序号 为 ; 的 元 素 ) 存 放 在 。 下 标 
数组 中 下 标 为 i 一 1 的 分 量 中 。len 表示 线性 表 当 0 区 1 
前 长 度 ,一 般 len 二 Maxsize, 从 数组 元 素 v[len] 到 lL a 2 
vLMaxsize 一 1] 是 备用 空间 ; len 同时 指明 了 最 后 。 : . 
一 个 数据 元 素 在 数组 中 的 位 置 。sqlist 为 描述 顺 二 
序 表 的 结构 体 类 型 名 ,以 后 对 顺序 表 的 操作 都 是 。 下 

备用 空间 

在 这 个 描述 的 基础 上 进行 的 。 Mexsizea! : 

假设 当前 有 一 顺序 表 (aj ,as,…,a,), 它 的 数 图 2.3 顺序 表 的 数组 实现 示意 图 
组 实现 示意 图 如 图 2. 3 所 示 。 

若 有 

sqlist 关 工 ; 


L 表示 指向 sqlist 顺序 表 类 型 的 指针 变量 , 则 线性 表 的 表 长 应 表示 为 (* L). len 或 工 一 > 
len, 第 i 个 元 素 写 为 (*L).v[Li 一 1] 或 (L 一 > vw[i 一 1]。 


2.2.2 顺序 存储 结构 的 优 缺 点 


由 于 线性 表 的 顺序 存储 结构 的 特点 是 逻辑 关系 上 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 
邻 ,因此 可 以 随机 存 取 表 中 任 一 元 素 ,其 存储 位 置 可 用 一 个 简单 直观 的 公式 来 表示 ,这 个 特 
点 使 其 具有 以 下 优 缺 点 。 


1. 优点 


(1) 随机 存 取 元 素 容 易 实 现 ,根据 定位 公式 容易 确定 表 中 每 个 元 素 的 存储 位 置 ,所 以 要 
指定 第 i 个 结 点 很 方便 。 
(2) 简单 、 直 观 。 


2. 缺点 


rl a i 


(1) 插入 和 删除 结 点 困难 。 

由 于 表 中 的 结 点 是 依次 连续 存放 的 ,所 以 插入 或 删除 一 个 结 点 时 ,必须 将 插入 点 以 后 的 
结 点 依次 向 后 移动 ,或 将 删除 点 以 后 的 结 点 依次 向 前 移动 。 

(2) 扩展 不 灵活 。 

建立 表 时 , 若 估 计 不 到 表 的 最 大 长 度 ,就 难以 确定 分 配 的 空间 ,影响 扩展 。 
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(3) 容易 造成 浪费 。 
分 配 的 空间 过 大 时 ,会 造成 预 留 空间 浪费 。 


2.2.3 顺序 表 上 的 基本 运算 


定义 线性 表 顺 序 存 储 结构 后 ,线性 表 的 某 些 操作 容易 实现 ,如 求 表 长 , 取 元 素 , 找 前 驱 元 
素 和 后 继 元 素 等 。 下 面 着 重 讨论 线性 表 的 插入 、 删 除 操作 的 实现 。 


1. 求 线性 表 的 长 度 


此 算法 比较 简单 ,只 要 取出 线性 表 的 长 度 值 就 可 以 了 。 
算法 2.1 求 顺序 表 的 长 度 算法 。 


/代为 sqlist 顺序 表 类 型 指针 变量 , lenth( sqlist * D) 求 顺序 表 工 的 长 度 
int length(sqlist *L) 
{ 
int length; 
length=L-> len; 
return( length); // 返 回 线 性 表 的 长 度 
} 


2. 插入 算法 


线性 表 的 插入 是 指 在 表 的 第 i 个 元 素 之 前 加 入 一 个 新 的 数据 元 素 ,使 长 度 为 n 的 线 

性 表 
(al 和 Qi-iyaiyyQn) 
变 成 长 度 为 ?十 1 的 线性 表 
(a 9 oad 1 Todi" da) 

插入 一 个 新 元 素 后 ,线性 表 的 数据 之 间 的 逮 辑 位 置 和 物理 位 置 都 相应 发 生 了 变化 。 如 
果 在 第 i(1 二 i 志 n) 个 元 素 之 前 插入 一 个 新 元 素 , 则 需要 及 一 i 十 1 个 元 素 进行 移动 ,只 有 
插入 的 位 置 为 2 十 1 时 , 才 无 须 移动 元 素 ,直接 将 元 素 插 入 表 尾 。 若 插入 成 功 则 返回 1 ,否则 
返回 0。 插 和 人 前 后 的 状况 如 图 2.4 所 示 。 


数组 下 标 ”数据 元 素 序号 数组 下 标 ”数据 元 素 序号 
0 18 1 0 18 | 
1 11 2 1 11 2 
2 17 3 2 17 3 
3 22 4 3 22 4 
在 第 6 个 元 素 4 7 5 4 7 5 
之 前 择 和 26 5 “| 10 6 5 26 6 
6 50 7 6 10 7 
7 28 8 了 50 8 
8 9 8 28 9 


图 2.4 顺序 表 插 入 前 后 状况 示意 图 


算法 思路 : 
(1) 判断 线性 表 的 存储 空间 是 否 已 满 , 若 已 满 , 则 进行 “溢出 处理。 
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(2) 检查 i 值 是 否 超出 所 允许 的 范围 (1 二 i 志 n 十 1) , 若 超出 , 则 进行 “超出 处理。 
(3) 将 线性 表 的 第 i 个 元 素 和 它 后 面 的 所 有 元 素 均 后 移 一 个 位 置 。 

(4) 将 新 的 数据 元 素 写 人 到 下 标 为 ;一 1 的 位 置 上 。 

(5) 线性 表 的 长 度 增加 1。 

算法 2.2 ”顺序 表 的 插入 算法 。 


/代为 sqlist 顺序 表 类 型 指针 变量 , i 为 插入 元 素 的 位 序号 ,x 为 插入 元 素 的 值 
int insert(sqlist *L, int i,elemtype x) 
{ 
db 
if (C-> len== Maxsize) // 判 断 线性 表 的 存储 空间 是 否 已 满 
{ 
printf(" 洲 出 \n"); 
return 0; 
} 
else 
if ((i<1)||i>L->lent+1) // 检 查 i 值 是 否 超 出 所 允许 的 范围 
{ 
printf(" 插 入 位 置 不 正确 \n"); 
return 0; 
} 
else 
for(j=L->len-1;j>=i-1;j--) // 将 第 个 元 素 和 它 后 面 的 所 有 元 素 均 后 移 


// 一 个 位 置 
L->vj+1] =L->v[j]; 
下 一 > = // 将 新 的 元 素 写 人 到 空 出 的 下 标 为 -1 的 位 置 上 
L->len=L->lent1; // 线 性 表 的 长 度 增加 1 


return 1; 
} 

} 

从 以 上 插入 算法 可 知 ,该 算法 主要 执行 时 间 都 在 移动 数据 元 素 的 循环 上 ,该 语句 循环 执 
行 的 次 数 为 n 一 i 十 1, 当 i 二 nn 十 1 时 ,移动 次 数 为 0; 当 i 二 1 时 ,移动 次 数 为 ,可见 算法 在 
最 坏 情 况 下 时 间 复 杂 度 为 O(n), 最 好 情况 下 时 间 复 杂 度 为 0(1)。 

假设 在 第 i 个 元 素 之 前 插入 一 个 元 素 的 概率 为 p; ,所 需 移动 数据 元 素 的 平均 次 数 为 


EY pn—itl) (2.2) 
设 在 线性 表 的 任何 位 置 上 插入 元 素 的 机 会 相等 ,可 能 插入 的 位 置 为 ?一 1,2,…,2 十 1， 
则 pj; 三 1/ (x 十 1), 上 式 简化 为 
1 站 . 1 . 1 nn+1) nn 
Bi i 十 1) 1 人 本 C03 
由 此 可 见 , 在 顺序 表 中 插入 一 个 元 素 ,平均 约 移动 表 中 一 半数 据 元 素 , 当 n 较 大 时 , 算 
法 的 效率 很 低 。 


3. 删除 算法 
线性 表 的 删除 运算 是 指 将 线性 表 的 第 i 个 数据 元 素 删 去 ,使 长 度 为 的 线性 表 
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《Ga 
变 成 长 度 为 n 一 1 的 线性 表 
(Gra) 
与 插入 操作 类 似 ,在 顺序 表 上 实现 删除 操作 也 必须 移动 元 素 才能 反映 出 元 素 间 逻辑 关 
系 的 变化 。 当 1<i<<n 一 1 时 需 将 第 i 十 1~n 个 数据 元 素 依次 向 前 移动 一 个 位 置 , 只 有 当 i 一 
时 直接 删除 表 中 最 后 一 个 元 素 。 删 除 成 功 返回 1, 否 则 返回 0。 删 除 前 后 的 状况 如 图 2. 5。 


数组 下 标 ”数据 元 素 。 序号 数组 下 标 ”数据 元 素 。 序号 

0 18 1 0 18 1 

下 I 2 1 11 p2 

2 17 3 2 17 3 

多 2 4 本 22 4 

删除 第 6 个 4 了 5 4 于 5 
元 素 10 5 “| 10 6 5 50 6 
G0 | 6 28 7 

28 8 了 8 

8 9 8 9 


图 2.5 顺序 表 删 除 前 后 状况 示意 图 


算法 思路 : 

(1) 判断 i 值 是 否 超 出 所 允许 的 范围 (1 三 i 过 n) ,若是 , 则 进行 “超出 范围 ”处 理 ; 
(2) 把 第 i 个 元 素 赋 给 y ; 

(3) 把 第 i 个 元 素 后 的 所 有 元 素 依 次 向 前 移动 一 个 位 置 ; 

(4) 线性 表 长 度 减 1。 

算法 2.3 顺序 表 的 删除 算法 。 

/人 为 sqlist 顺序 表 类 型 指针 变量 , i 为 删除 元 素 的 位 序号 ,删除 元 素 的 值 通过 y 代 出 


int dele(sqlist *L, int i,elemtype *y) 
{ 


int j; 
if ((i<1)||(i>L->1en)) // 判 断 二 值 是 否 超 出 所 允许 的 范围 
{ 
printf(" 删 除 位 置 不 正确 \n"); 
return 0; 
i 
else 
{ 
xy=L->v[i-1]; // 把 第 并 个 元 素 赋 给 * Y 
for(j=i;j<L-> len;j++) // 把 第 i 个 元 素 后 的 所 有 元 素 依次 向 前 移动 一 个 位 置 
L->v[j-1]=L->v[j]; 
L->len=L->len-1; // 线 性 表 长 度 减 1 
return 1; 


} 
$ 
删除 算法 和 插入 算法 相似 , 当 ;i 一 1 时 ,移动 n 一 1 个 元 素 , 当 i 二 =n 时 ,不 需 移 动 , 故 算法 
的 时 间 复 杂 度 为 O(n)。 
假设 删除 第 i 个 元 素 的 概率 为 gq; ,所 需 移动 数据 元 素 的 平均 次 数 为 


Ej,= Dgi(n—i) (2.4) 


设 在 线性 表 的 任何 位 置 上 删除 元 素 的 机 会 相等 ,可 能 删除 的 位 置 为 ;一 1,2,…,, 则 
gi 二 1/n， 上 式 简化 为 
l9o i) 3 了 “2 (2.5) 
由 此 可 见 ,在 顺序 表 中 删除 一 个 元 素 ,平均 约 移动 表 中 一 半数 据 元 素 , 当 较 大 时 , 算 
法 的 效率 很 低 。 


4. 查找 算法 


线性 表 的 查找 是 指 找 出 数据 元 素 x 在 表 中 的 位 序号 , 若 v[ 让 二 x, 则 算法 返回 值 为 i 十 1; 
若 不 存在 数据 元 素 x 则 返回 0。 
算法 2.4 顺序 表 的 查找 算法 。 


// 从 顺序 表 工 中 查找 指定 键 值 为 x 的 元 素 位 序号 
int search(sqlist *L,elemtype x) 
{ 


Wk 


for (i=0;i<L->1en;it+) // 在 线性 表 中 顺序 查找 
if (x==L->v[i]) 
break; 
if (i<L—-> 1en) 
return (i+1); 
else return(0); 


} 


@.3 线性 表 的 链 式 存储 结构 一 一 链表 


顺序 表 结 构 简 单 , 便 于 随机 访问 表 中 的 任 一 元 素 , 但 顺序 存储 结构 不 利于 插入 和 删除 ， 


不 利于 扩充 ,也 容易 造成 空间 浪费 。 为 了 弥补 这 些 缺 点 ,本 节 将 讨论 线性 表 的 另 一 种 存储 结 
构 , 即 链 式 存储 结构 。 


常见 的 链表 有 单 链 表 、 循 环 链表 和 双向 链表 。 链 式 存 储 是 最 常用 的 存储 方法 之 一 , 它 不 
仅 可 以 表示 线性 表 , 还 可 以 表示 各 种 复杂 的 非 线性 数据 结构 。 


2.3.1 单 链 表 
1. 单 链表 的 定义 


用 一 组 任意 的 存储 单元 存储 线性 表 的 数据 元 素 ( 这 组 存储 单元 可 以 是 连续 的 ,也 可 以 是 
不 连续 的 ) ,数据 元 素 之 间 的 逻辑 关系 借助 指示 元 素 存储 位 置 的 指针 来 表示 ,这 种 存储 方式 
叫 作 线 性 表 的 链 式 存 储 结构 ,简称 链表 (linked list) 。 为 了 表示 数据 元 素 间 的 逻辑 关系 , 除 
了 存储 数据 元 素 本 身 的 信息 之 外 ,还 需要 存放 其 直接 后 继 的 存储 位 置 (存储 地 址 ) ,这 两 部 分 
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组 成 一 个 结 点 ,用 于 表示 线性 表 中 的 一 个 数据 元 素 。 这 样 ,存放 数据 元 素 的 结 点 包括 两 个 
域 : 一 个 是 数据 域 , 用 于 存储 数据 元 素 的 信息 ; 另 一 个 是 指针 域 或 链 域 ,用 于 存放 直接 后 继 
元 素 的 存储 位 置 (存储 地 址 )。 这 种 用 指针 链接 的 结 点 序列 称 为 链表 。 若 链表 中 的 每 个 结 点 
只 包含 一 个 指针 域 , 则 称 此 链表 为 线性 链表 或 单 链表 。 一 般 地 ,把 链表 画 成 用 箭头 相 链 接 的 
结 点 的 序列 , 结 点 之 间 的 箭头 表示 链 域 中 的 指针 ,如 图 2. 6 所 示 。 当 然 ,链表 的 每 个 结 点 可 
以 有 若干 个 数据 域 和 指针 域 。 


| | | 


据 域 ”指针 域 


图 2.6 单 链表 示意 图 


顺序 表 和 线性 链表 的 区 别 如 下 。 

(1) 顺序 表 中 ,所 有 数据 元 素 是 依次 存放 在 一 组 连续 的 存储 单元 中 ,数据 元 素 在 线性 表 
中 的 逻辑 序号 可 以 确定 它 在 存储 单元 中 的 位 置 ,逻辑 上 相 邻 的 两 个 数据 元 素 其 物理 存储 位 
置 也 相 邻 。 

(2) 线性 链表 中 , 结 点 在 存储 器 中 的 位 置 是 任意 的 , 结 点 之 间 的 逻辑 关系 由 结 点 中 的 指 
针 来 指示 ,由 图 2.7 可 见 单 链表 的 存储 结构 。 


存储 地 址 数据 域 着 针 域 
1 Beijing 25 
7 Shanghai 13 
头 指 针 H 13 Chongqing 1 
3l 19 Hunan NULL 
25 Yunnan 19 
1 Tianjin 日 


图 2.7 单 链表 的 存储 结构 示例 


也 是 指针 变量 ,该 变量 保存 着 指向 单 链表 的 第 一 个 结 点 的 指针 , 称 为 头 指针 变量 ,简称 
头 指针 。 对 单 链 表 中 任 一 结 点 的 访问 必须 从 头 指 针 开始 ,首先 找到 第 一 个 结 点 ,再 按 各 结 点 
链 域 中 存放 的 指针 顺序 往 下 找 , 直 到 找到 所 需 的 结 点 。 此 外 ,由 于 最 后 一 个 数据 元 素 没有 直 
接 后 继 , 则 单 链表 中 最 后 一 个 结 点 的 指针 为 空 ,用 人 或 NULL 表示 。 若 线性 表 为 空 , 则 头 指 
针 为 空 。 由 此 可 见 , 单 链表 中 逻辑 上 相 邻 的 两 个 元 素 ,其 存储 的 物理 位 置 不 一 定 相 邻 。 使 用 
链表 时 ,应 该 关注 它 的 逻辑 结构 ,而 不 是 每 个 元 素 在 存储 器 中 的 位 置 。 图 2. 8 所 示 为 单 链表 
的 逻辑 结构 示例 。 


Tian| 7 
jin 


Hl 


Shang| 13 = Chong| 1 Bei | 25 Yun| 19 Hu 入 


hai qing jing nan nan 


图 2.8 单 链表 的 逻辑 结构 示例 


有 时 为 了 操作 方便 ,在 单 链表 的 第 一 个 结 点 之 前 添加 一 个 结 点 , 称 头 结 点 或 伪 结 点 。 头 
结 点 的 数据 域 可 以 不 存放 任何 信息 ,也 可 以 存放 其 他 特殊 信息 ; 头 结 点 的 指针 域 存放 第 一 
个 元 素 结 点 的 存储 地 址 , 即 指向 第 一 个 结 点 的 指针 值 。 此 时 , 单 链表 的 头 指针 指向 头 结 点 ， 
称 其 为 带头 结 点 的 单 链 表 。 本 书 以 下 若 无 特殊 说 明 , 采 用 的 都 是 带头 结 点 的 单 链表 ,如 
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图 2.9 所 示 。 


jin hai qing jing nan nan 


31 。 | Tian 7 ee 13 。|Chong| 1 =| Bei 25 | Yun 19 上 =| Hu 人 入 


二 


图 2.9 带头 结 点 的 单 链表 逻辑 结构 示例 
单 链表 可 以 用 C 语言 的 指针 数据 类 型 来 实现 ,对 单 链表 的 结 点 类 型 描述 如 下 : 


typedef struct node 

{elemtype data; 

struct node * next; 

}inode, * linklist; /VEnode 为 结 点 类 型 , linklist 为 指向 结 点 的 指针 类 型 

后 面 的 各 种 运算 都 在 上 述 定义 的 基础 上 实现 。 

上 面 定义 了 一 种 结 点 类 型 ,struct node 和 Lnode 都 是 结 点 类 型 名 ,一 般 常用 Lnode; 
elemtype 为 数据 域 的 类 型 , 它 可 以 是 任何 类 型 ,根据 具体 的 问题 确定 它 的 类 型 ; data 为 数据 
域 ,存放 当前 结 点 的 数据 ,类 型 为 elemtype; next 为 指针 域 ,存放 当前 结 点 的 直接 后 继 结 点 
的 存储 地 址 , 即 指向 当前 结 点 的 直接 后 继 结 点 。 

假设 h 是 链表 的 头 指针 ,p 是 指向 链表 中 某 一 结 点 的 指针 ,可 以 说 明 如 下 : 


Lnode *h,*p; 


或 

linklist hy p; 

p 及 其 指向 的 结 点 的 关系 如 图 2. 10 所 示 。 p——e| data | next 

(1) 用 p 一 > data 或 (*p). data 表示 p 所 指向 的 结 点 的 图 2.10 bp 及 其 指向 的 结 点 的 关系 
数据 域 ; 

(2) 用 p 一 > next 或 (* p). next 表示 p 所 指向 的 结 点 的 指针 域 。 

需要 注意 的 是 ,p 在 被 定义 成 指针 变量 时 ,并 没有 指向 任何 结 点 ,需要 在 程序 执行 过 程 


中 通过 按 结 点 的 类 型 向 系统 申请 建立 一 个 新 结 点 ,通过 调用 标准 函数 malloc() 动 态 生成 , 具 
体格 式 为 : 

p= (Lnode * )malloc(sizeof(Lnode)); 
其 中 ,sizeof(Lnode) 用 来 测算 Lnode 类 型 的 结 点 需 占用 的 字 节 数 ; (Lnode * ) 用 来 进行 类 
型 转换 ,使 得 malloc() 函数 返 回 一 个 指向 Lnode 结 点 类 型 的 指针 ,并 将 该 指针 (该 结 点 的 首 
地 址 ) 赋 给 p。 

当 不 需要 p 结 点 时 ,应 该 用 标准 函数 free(p) 来 释放 p 所 指向 的 结 点 空间 , 即 系统 收回 
P 结 点 。 


2. 单 链表 的 基本 运算 


对 单 链表 的 操作 都 必须 从 头 结 点 开始 , 单 链表 是 非 随机 存 取 的 存储 结构 。 下 面 讨论 如 
何 实现 单 链表 的 “建立 “ 求 表 长 “查找 “插入 ”和 “删除 ”等 基本 操作 。 
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1) 建立 带头 结 点 的 单 链表 | 


从 表 尾 到 表 头 逆向 建立 带头 结 点 单 链表 ( 头 插 法 ) 的 过 程 如 | i 
图 2.11 所 示 。 

算法 思路 : p 

(1) 首先 建立 一 个 头 结 点 h, 并 使 头 结 点 的 指针 域 为 空 ; 图 2.11 头 插 法 建立 带头 结 点 

(2) 读 入 值 ch; 的 单 链表 


(3) 建立 一 个 新 结 点 p; 

(4) 将 ch 赋 给 p 的 数据 域 ; 

(5) 分 别 改变 新 结 点 p 的 指针 域 和 头 结 点 h 的 指针 域 ,使 p 成 为 h 的 直接 后 继 ; 
(6) 重复 (2) 一 (5) ,直到 不 满足 循环 条 件 为 止 。 

算法 2.5 ” 头 插 法 建立 带头 结 点 的 单 链表 算法 。 


// 头 捅 法 建立 带头 结 点 的 单 链 表 
typedef char elemtype; 
typedef struct node 
{ 
elemtype data; 
struct node * next; 
}inode, * linklist; //Lnode 为 结 点 类 型 , 1inklist 为 指向 结 点 的 指针 类 型 
// 表 头 插入 法 ,建立 带头 结 点 的 单 链表 ,通过 函数 返回 头 指针 
Lnode * creat() 
{ 


FILE * fp; 

elemtype ch; 

Lnode *h,*p; 

h= (Lnode * )malloc(sizeof(Lnode) ); // 建 立 头 结 点 

h-> next = NULL; // 使 头 结 点 的 指针 域 为 空 


if ((fp = fopen("inputfile.txt","r")) == NULL) // 从 inputfile.txt 文件 输入 元 素 的 值 
{ 
printf("can't open the file\n"); 
exit(0); 
} 
while(!feof(fp)) 


{ 
fscanf(fp, " %c", gch); 


p= (Lnode* )malloc( sizeof(Lnode)); // 建 立 一 个 新 结 点 p 
p->data= ch; // 将 ch 赋 给 p 的 数据 域 
p->next=h-> next; // 改 变 指针 状况 
h-> next=p; //h 的 直接 后 继 是 p 

} 

fclose( fp); 

return h; 


和. 


从 表 头 向 表 尾 顺序 建立 带头 结 点 的 单 链表 ( 尾 插 法 ) 的 算法 如 算法 2. 6 所 示 。 
算法 2.6 尾 插 入 法 建立 带头 结 点 单 链表 算法 。 


// 表 尾 插入 法 ,建立 带头 结 点 的 单 链表 ,通过 函数 返回 头 指针 
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Lnode * creat() 
{ 
Lnode x*h, *p,*t; 
elemtype ch; 
h= (Lnode * )malloc(sizeof(Lnode)); 
h-—> next = NULL; 
t=h; 
if ((fp = fopen("inputfile.txt","r")) == NULL) // 从 inputfile. txt 文件 输入 元 素 的 值 
{ 
printf("can't open the file\n"); 
exit(0); 
} 
while( ! feof (fp)) 
{ 
fscanf(fp," %c",&ch); 
p= (Lnode * )malloc(sizeof(Lnode)); 
p->data= ch; 
p-> next = NULL; 
t->next=p; 
t=p; //t 始终 指向 最 后 一 个 元 素 
} 
return h; 


} 


2) 求 带 头 结 点 单 链表 的 长 度 

求 单 链表 的 长 度 即 求 表 中 结 点 的 个 数 ,并 返回 其 长 度 。 

算法 思路 : 

(1) 设置 一 个 工作 指针 变量 p, 再 设置 一 个 整 型 变量 i 作 计数 器 ; 
(2) 让 Pp 指向 第 一 个 数据 结 点 , 置 i 为 0; 

(3) 指针 p 在 单 链表 中 后 移 并 且 i 值 加 1; 

(4) 当 p=NULL 时 说 明 单 链表 结束 ,计数 完毕 ,这 时 i 的 值 正好 是 表 长 。 
算法 2.7 求 带头 结 点 单 链表 的 长 度 算法 。 

//h 是 带头 结 点 单 链表 的 头 指针 , 函数 返回 单 链表 的 长 度 

int length(Lnode * h) 

{ 


Lnode *p; 
int i= 0; 
p=h->next; //p 指向 第 一 个 结 点 
while(p) // 循 环 访问 单 链表 的 每 个 结 点 ,p= NULL 时 结束 
{ 
tt 
p=p->next; //p 指针 后 移 
} 
return i; 


} 
该 算法 的 基本 操作 是 指针 p 后 移 和 计数 ,执行 次 数 为 n, 故 时 间 复 杂 度 为 O(n)。 
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从 头 结 点 开始 ,通过 工作 指针 的 不 断后 移 而 访问 单 链 表 的 每 个 结 点 的 扫描 (遍历 ) 技 术 
是 一 种 常用 技术 ,在 许多 算法 中 都 要 用 到 。 

3) 插入 算法 

在 单 链 表 中 p 结 点 之 后 插入 值 为 x 的 新 结 点 s。 插 人 算法 中 需要 修改 结 点 的 指针 域 ， 
插入 前 后 指针 变化 状况 如 图 2. 12 所 示 。 


p 
| 
mi 
P wT | 
i “| 一 t. 
(a) 插入 前 人 b) 插 入 后 


图 2.12 在 单 链表 中 插入 结 点 的 指针 变化 状况 


指针 的 修改 用 下 列 两 个 语句 描述 : 

(1) s 一 > next=p—> next; 

(2) p 一 > next=s; 

算法 思路 : 

(1) 生成 一 个 新 结 点 s; 

(2) 将 x 赋 给 新 结 点 s 的 数据 域 ; 

(3) 将 新 结 点 插入 单 链 表 中 。 

算法 2.8 在 带头 结 点 单 链表 的 某 结 点 后 插入 算法 。 


// 将 值 为 x 的 元 素 插 在 带头 结 点 单 链表 中 p 结 点 之 后 

void insert(Lnode * p,elemtype x) 

{ 
Lnode *#*s; 
s= (Lnode * )malloc(sizeof(Lnode));  // 生 成 一 个 新 结 点 s 
s->data=x; 
s->next=p->next; // 新 结 点 链 入 单 链表 中 
p->next=s; 


} 


该 算法 的 时 间 复 杂 度 为 0(1)。 
下 面 介绍 在 单 链表 中 第 i 个 元 素 之 前 插入 一 个 元 素 的 算法 。 
算法 2.9 在 带头 结 点 单 链表 的 第 i 个 元 素 之 前 插入 算法 。 


// 在 带头 结 点 单 链表 中 第 i 个 元 素 之 前 插入 一 个 值 为 x 的 元 素 
int insert(Lnode * h, int i,elemtype x) 
{ 
Lnode x*p,*s; 
int j; 
p=h; 
a 
while(p&&j <i—1) // 寻 找 第 i-1 号 结 点 
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{ 

p=p->next; 

j++; 

} 

if(p) 

{ 
s= (Lnode * )malloc(sizeof(Lnode)); 
s->data=x; 


s—>next=p->next; // 改 变 指针 状态 ,将 s 插 入 表 中 
p->next=s; 
return(1); // 返 回 1 表示 正常 结束 
} 
else 
return (0); // 返 回 0 表示 插入 失败 
} 
该 算法 时 间 复 杂 度 为 O(n)。 
4) 删除 算法 


删除 单 链 表 中 p 的 后 继 结 点 qa。 删除 算法 中 也 需要 修改 结 点 的 指针 域 ,删除 前 后 指针 
变化 状况 如 图 2. 13 所 示 。 


—| a Pe b P| ce eo 


图 2.13 在 单 链表 中 删除 结 点 的 指针 变化 状况 


指针 的 修改 用 下 列 两 个 语句 描述 .: 

(1) q=p—> next; 

(2) p 一 > next 一 q 一 > next; 

算法 思路 : 

(1) 将 gq 指向 p 结 点 的 直接 后 继 ; 

(2) 改变 指针 链接 ,把 q 结 点 的 直接 后 继 作为 p 结 点 的 直接 后 继 ; 
(3) 从 单 链表 中 删除 q 结 点 ; 

(4) 释放 q 结 点 空间 。 

算法 2.10 删除 带头 结 点 单 链 表 中 p 的 后 继 结 点 算法 。 


void dele(Lnode * p) 
{ 


Lnode *q; 

if (p—> next!= NULL) 

{ 
q=p->next; //q 为 p 的 直接 后 继 
p->next=q->next; // 删 除 q 


free(q) // 释 放 q 结 点 空间 
} 
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该 算法 的 时 间 复 杂 度 为 0(1)。 


思考 ; 如 果 要 求 在 带头 结 点 单 链表 中 删除 第 i 个 元 素 该 如 何 实现 ? 


5) 按 值 查找 


查找 带头 结 点 单 链表 中 是 否 存 在 数据 域 为 x 的 结 点 , 若 有 该 结 点 , 则 返回 指向 该 结 点 的 


指针 ,否则 返回 空 。 
算法 思路 : 


(1) 从 第 一 个 结 点 开始 扫描 整个 单 链表 ,将 结 点 数据 域 的 值 逐 个 与 x 比较 ; 
(2) 找到 该 结 点 后 返回 指向 该 结 点 的 指针 ,否则 返回 空 。 


算法 2. 11 


// 查 找 带头 结 点 单 链表 中 值 为 x 的 结 点 
Lnode * search(Lnode * h,elemtype x) 
{ 
Lnode *p; 
p=h->next; 
while(p&&p— > data!= x) 
p=p->next; 
return (p); 


} 

该 算法 的 时 间 复 杂 度 为 O(n)。 

6) 取 元 素 

读 取 带头 结 点 单 链 表 中 的 第 i 个 元 素 


带头 结 点 单 链表 按 值 查找 算法 。 


//p 为 单 链表 的 第 一 个 结 点 
// 扫 描 整 个 单 链表 , 查找 值 为 x 的 结 点 
// 未 找到 ,指针 继续 后 移 扫描 


。 如 果 找 到 , 则 返回 第 ;个 结 点 的 存储 地 址 ,和 否则 


返回 空 。 在 单 链表 中 无 法 直接 获得 第 i 个 元 素 的 值 ,只 有 从 头 指针 出 发 , 顺 着 链 域 往 下 搜 


索 ,直到 找到 第 i 个 结 点 为 止 。 
算法 思路 : 


(1) p 从 单 链 表 的 第 一 个 数据 结 点 出 发 ,并 定义 7 一 1; 
(2) 在 单 链表 中 移动 指针 p, 同 时 累计 j; 

(3) 通过 j 的 累计 查找 j==i 的 结 点 ; 

(4) 重复 (2)、(3) 直 到 p 为 空 或 p 指向 第 i 个 元 素 。 

算法 2.12 读 取 带头 结 点 单 链表 中 第 i 个 元 素 地 址 算法 。 


Lnode * get(Lnode * h, int i) 
| 
int j; 
Lnode *#*P; 
p=h->next; 
j=1; 
while (pg&j < i) 
{ 
p=p->next; 
j++; 
二 
(i==) 
return p; // 返 回 第 i 个 元 素 的 存储 地 址 


else 


// 移 动 指针 p, 直到 p 为 空 或 p 指 向 第 i 个 元 素 
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return NULL; 
} 
该 算法 的 基本 操作 是 指针 p 后 移 和 计数 ,执行 次 数 与 所 给 i 值 有 关 , 当 i=1 时 ,执行 次 数 
为 0; 当 i=1 时 ,执行 次 数 为 1; i 三 n 时 ,执行 次 数 为 n ,平均 约 为 n/2, 所 以 T(n) 二 O(n)。 
2.3.2 循环 链表 和 双向 链表 
1. 循环 链表 


循环 链表 是 一 种 首尾 相 接 的 链表 。 在 单 链 表 中 ,如 果 最 后 一 个 结 点 的 链 域 值 不 是 
NUIL ,而 是 指向 头 结 点 , 则 整个 链表 形成 一 个 环 , 它 是 另 一 种 形式 的 链 式 存 储 结构 , 称 为 单 
循环 链表 。 在 单 循环 链表 中 ,为 了 使 空 表 和 非 空 表 的 处 理 一 致 , 同 样 设置 了 一 个 头 结 点 。 在 
建立 单 循环 链表 时 ,建立 头 结 点 后 ,应 有 “h 一 > next 二 h;” 语 句 。 图 2. 14 所 示 为 带头 结 点 的 
单 循环 链表 示意 图 。 


ET - -ED ASD 


非 空 表 衬 表 
图 2.14 带头 结 点 的 单 循环 链表 示意 图 


类 似 地 ,还 有 多 循环 链表 。 
循环 链表 的 特点 是 从 表 中 任意 结 点 出 发 均 可 以 找到 表 中 其 他 的 结 点 ,这 样 使 得 某 些 运 
算 在 循环 链表 上 易于 实现 。 
单 循环 链表 上 的 操作 实现 和 单 链表 上 基本 一 致 ,但 需要 将 算法 中 的 循环 条 件 p 或 p 一 > 
next 是 否 为 空 改 为 是 否 等 于 头 指 针 。 
算法 2.13 ”在 单 循环 链表 中 查找 算法 。 
// 在 单 循环 链表 中 查找 值 为 x 的 结 点 
Lnode * get(Lnode * h,elemtype x) 
下 
Lnode *p; 
p=h->next; 
while (p!= hg&&x!= p—> data) // 循 环 扫描 查找 ,直到 p 指向 头 结 点 h 或 找到 x 结束 
p=p->next; 
if(p== h) 
return NULL; 


return p; 


. 


2. 双向 链表 


在 单 链表 中 ,每 个 结 点 只 有 一 个 指针 域 指向 其 直接 后 继 , 这 样 方便 找到 其 后 继 。 如 果 要 
便于 找 前 驱 ,可 以 再 加 上 一 个 指向 其 前 驱 的 指针 域 。 这 样 ,链表 的 每 一 个 结 点 中 有 两 个 指针 
域 : 一 个 指向 直接 后 继 ; 另 一 个 指向 直接 前 驱 。 这 种 链表 称 为 双向 链表 。 
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双向 链表 的 结 点 描述 为 : 


typedef struct dulnode 
{elemtype data; 
struct dulnode * next, x* prior; 
}dulnode; 
其 中 ,data 为 数据 域 ; next 为 指向 结 点 的 直接 后 继 的 指针 域 ; prior 为 指向 结 点 的 直接 前 驱 
的 指针 域 ; dulnode 为 双向 链表 的 结 点 类 型 名 。 
双向 链表 及 结 点 结构 如 图 2. 15 所 示 。 


1 | f 1 | 
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空 表 结 点 结构 


图 2.15 双向 链表 及 结 点 结构 
显然 ,在 双向 链表 中 ,要 找 每 一 个 结 点 的 前 驱 和 后 继 都 很 方便 。 
3. 双向 循环 链表 


和 单 循环 链表 一 样 ,双向 链表 也 有 循环 链表 ,如 图 2. 16 所 示 。 将 双向 链表 中 的 头 结 点 
和 尾 结 点 链接 起 来 ,就 形成 了 双向 循环 链表 。 


， i i i 
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图 2.16 双向 循环 链表 及 结 点 结构 


从 图 2. 16 可 以 看 出 ,双向 循环 链表 是 将 头 结 点 的 前 驱 指 针 指 向 了 尾 结 点 ,同时 将 尾 结 
点 的 后 继 指 针 指向 了 头 结 点 。 在 空 的 双向 循环 链表 中 , 头 结 点 的 前 驱 和 后 继 指 针 均 指向 了 
它 自 己 , 这 也 是 判断 双 循环 链表 是 否 为 空 的 条 件 。 

显然 ,双向 循环 链表 具有 对 称 性 。 

在 双向 (循环 ) 链 表 中 实现 某 些 操作 时 ,涉及 两 个 方向 的 指针 ,下 面 以 双向 循环 链表 为 例 
讨论 插入 和 删除 算法 。 

1) 插入 算法 

假设 在 结 点 p 之 前 插入 结 点 s, 必 须 改变 指针 的 链接 。 图 2. 17 显示 了 插入 结 点 时 指针 
修改 的 情况 。 

可 见 ,改变 指针 链接 的 语句 有 : 
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图 2.17 在 双向 链表 上 插入 结 点 时 指针 变化 示意 图 


(1) s 一 > prior= p-> prior; 

(2) p 一 > prior-> next 一 S; 

(3) s 一 > next=p; 

(4) p 一 > prior=s; 

算法 2. 14 实现 在 双向 循环 链表 的 第 i 个 结 点 之 前 插入 值 为 x 的 新 结 点 ,如 果 成 功 , 则 


返回 1 ,否则 返回 0。 


算法 思路 : 

(1) 通过 指针 p 的 移动 在 双向 循环 链表 中 依次 查找 第 i 个 元 素 ; 

(2) 如 果 找 到 , 则 建立 一 个 新 结 点 s; 

(3) 将 s 和 op 以 及 Pp 的 前 驱 链 接 起 来 , 即 令 s 的 前 驱 是 p 原来 的 前 驱 ,s 的 后 继 是 p。 
算法 2.14 双向 循环 链表 的 插入 算法 。 


// 在 双向 循环 链表 的 第 i 个 结 点 之 前 插入 值 为 x 的 新 结 点 
int insert(dulnode *h, int i,elemtype x) 
| 
dulnode x*p,*s; 
int j; 
p=h->next; 
ds1s 
// 查 找 第 站 个 元 素 , 直 到 p 指向 头 结 点 h 或 p 指 向 第 并 个 元 素 结束 
while(p!= h&&j < i) 
| 
j++; 
p=p->next; 
} 
if(j== i) // 找 到 了 第 个 结 点 
{ 
s= (dulnode * )malloc(sizeof(dulnode)); 
s->data=x; 
s->Pprior=p->prior; // 改 变 指针 链接 ,使 s 插 入 在 p 之 前 
p->prior—->next=s; 
s->next=p; 
Pp->Pprior=s; 
return 1; 


else 


return 0; 
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2) 删除 算法 
假设 删除 第 i 个 结 点 p 也 必须 改变 指针 的 链接 。 图 2. 18 显示 了 删除 结 点 时 指针 修改 


的 情况 。 
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图 2.18 在 双向 链表 上 删除 结 点 的 指针 变化 示意 图 
可 见 ,改变 指针 链接 的 语句 有 : 


(1) p 一 > prior 一 > next=p—> next; 


(2) p 一 > next 一 > prior 一 p 一 > prior; 


算法 2. 15 实现 删除 双向 循环 链表 的 第 i 个 结 点 p, 如 果 成 功 , 则 返回 删除 结 点 的 值 , 否 


则 返回 0。 


算法 思路 : 
(1) 通过 指针 p 的 移动 在 双向 循环 链表 中 依次 查找 第 i 个 元 素 ; 
(2) 如 果 找 到 , 则 改变 指针 链接 , 即 令 p 的 前 驱 指 向 p 的 后 继 ,p 的 后 继 结 点 的 前 驱 指 针 


指向 p 原来 的 前 驱 ; 


(3) 释放 p。 
算法 2.15 删除 双向 循环 链表 的 删除 算法 。 


// 删 除 双向 循环 链表 的 第 i 个 结 点 
elemtype dele(dulnode * h, int i) 
{ 
elemtype s; 
dulnode *p; 
int j; 
p=h->next; 
j=1; 
while (p!= hg&j < i) // 在 双向 链表 中 依次 查找 第 i 个 元 素 
{ 
j++; 
p=p->next; 
} 
if(j== i) // 找 到 了 第 个 结 点 
| 
s=p-> data; 
p->prior->next=p->next; // 删 除 结 点 p 
p->next—>prior=p-> prior; 
free(p); // 释 放 p 结 点 空间 
return s; 
} 
else 
return 0; 


} 
显然 以 上 两 个 算法 的 时 间 复 杂 度 与 单 链表 的 一 样 ,为 O(n)。 
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61 线性 表 的 应 用 示例 


前 面 讨论 了 线性 表 的 两 种 存储 结构 
应 用 中 采用 哪 种 存储 结构 合适 呢 ? 

顺序 表 的 特点 是 逻辑 关系 上 相 邻 的 数据 元 素 在 物理 位 置 上 也 相 邻 ,数据 元 素 在 表 中 的 
位 置 可 以 通过 序号 或 数组 下 标 直接 表示 。 因 此 ,在 表 中 方便 随机 地 存 取 任 一 元 素 ,也 方便 求 
表 的 长 度 。 但 在 进行 插入 或 删除 操作 时 ,需要 移动 大 量 元 素 , 尤 其 是 当 线 性 表 的 数据 元 素 是 
很 复杂 的 信息 时 ,移动 的 工作 量 非常 大 。 

链表 的 数据 元 素 之 间 的 逻辑 关系 用 指针 来 表示 ,因此 ,在 进行 插 和 人 或 删除 操作 时 不 需要 
移动 元 素 ,只 需要 修改 指针 。 但 是 ,链表 是 非 随机 存 取 的 存储 结构 ,要 访问 表 中 的 元 素 ,必须 
从 第 一 个 元 素 开始 查找 。 

可 见 , 线 性 表 的 顺序 存储 和 链 式 存储 各 有 优 缺 点 ,应 用 中 应 该 根据 实际 问题 的 需要 来 进 
行 选 择 。 

学 习 了 线性 表 的 基本 运算 后 ,在 实现 线性 表 的 其 他 操作 时 ,可 以 调用 已 有 算法 间接 实 
现 ; 另外 ,掌握 了 编写 算法 的 一 些 基本 技能 和 技巧 ,可 以 写 出 直接 实现 的 高 效率 算法 。 

为 了 更 好 地 掌握 线性 表 及 其 运算 ,下 面 讨论 几 个 典型 的 算法 。 

例 2.1 编写 一 个 算法 将 一 个 顺序 表 原 地 逆 置 , 即 不 允许 新 建 一 个 顺序 表 。 

算法 思想 : 将 原 表 中 的 第 一 个 元 素 变 成 新 表 中 的 最 后 一 个 元 素 , 原 表 中 的 最 后 一 个 元 
素 变 成 第 一 个 元 素 ,中 间 元 素 以 此 类 推 。 

算法 2. 16 顺序 表 原 地 逆 置 算法 。 


void inverse(sqlist *L) 


{ 


顺序 存储 结构 和 链 式 存储 结构 。 那 么 ,在 实际 


elemtype t; 

int n= L-> len; 

for(int i=0;i<= (n-1)/2;i+t+) 

{ 
t= (L->v)[il; 
(L->v)[il]= (L->v)[n-i-1]; 
(L->v)[n-i-1]=t; 

Ll 

} 


例 2.2 编写 一 个 算法 将 一 个 带头 结 点 单 链表 逆 置 ,要 求 在 原 表 上 进行 ,不 允许 重新 建 
链表 。 

算法 思想 : 在 遍历 原 表 的 时 候 , 从 原 表 的 第 一 个 结 点 开始 ,将 各 结 点 的 指针 逆转 ,最 后 
修改 头 结 点 的 指针 域 , 令 其 指向 原 表 的 最 后 一 个 结 点 , 即 新 表 的 第 一 个 结 点 。 

算法 2.17 单 链表 原 地 逆 置 算法 。 

// 对 带头 结 点 单 链表 bh 原 地 逆 置 

int inverse(Lnode * h) 


{ 
Lnode *r,*q,*p; 
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p=h->next; 


if(p== NULL) // 车 链表 为 空 ,无 须 反 序 
return 0; 

else if(p—> next == NULL) // 若 链表 上 只 有 一 个 结 点 ,无 须 反 序 
return 0; 

q=P; 

p=p->next; 

q -> next = NULL; // 首 结 点 变 成 了 尾 结 点 

while(p) 


r=p->next; 


p->next=q; // 北 转 指针 

q=p; // 指 针 前 移 

划一 7 
} 
h->next=q; // 头 指针 h 的 后 继 是 q 
return 1; 


} 


例 2.3 编写 一 算法 将 两 个 按 元 素 值 递增 有 序 排列 的 单 链表 A 和 B 归并 成 一 个 按 元 素 
值 递增 有 序 排列 的 单 链表 C。 

分 析 : 对 两 个 或 两 个 以 上 结 点 按 元 素 值 有 序 排列 的 单 链表 进行 操作 时 ,应 采用 “指针 平 
行 移动 ,依次 扫描 完成 ”的 方法 。 从 两 表 的 第 一 个 结 点 开始 沿 着 链表 逐个 将 对 应 数据 元 素 进 
行 比较 ,复制 小 的 数据 元 素 并 插入 C 表 尾 。 当 两 表 中 之 一 已 到 表 尾 , 则 复制 另 一 个 链表 的 
剩余 部 分 ,插入 到 C 表 尾 。 设 pa、pb 分 别 指向 两 表 当 前 结 点 ,p 指向 C 表 的 当前 表 尾 结 点 。 
若 设 A 中 当前 所 指 的 元 素 为 a,B 中 当前 所 指 的 元 素 为 5, 则 当前 应 插入 到 C 中 的 元 素 c 为 

a a<b 


c= 
b a>6b 
例如 ， A=(3,5,8,11) 
B=(2,6,8,9,11,15,20) 
则 
C=(2,3,5,6,8,8,9,11,11,15,20) 
算法 2.18 有 序 单 链表 归并 算法 。 


// 对 pa 和 pb 两 个 有 序 单 链表 进行 归并 ,返回 归并 后 的 有 序 单 链表 
Lnode * hb(Lnode * pa, Lnode * pb) 

{ 

Lnode * Pp, *q, *pc; 

pb = pb 一 > next; 

pa= pa 一 > next; 


pc = (Lnodex )malloc(sizeof(Lnode) ) ; // 建 立 表 C 的 头 结 点 pc 
p= pce; //p 指 向 表 C 头 结 点 
while( pag&pb) 
* 
q= (Inode * )malloc(sizeof (Lnode)); // 建 立新 结 点 q 
if(pb-> data<pa—> data) // 比 较 AR.B 表 中 当前 结 点 的 数据 域 值 的 大 小 


. 
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q-> data= pb 一 > data; //B 表 中 结 点 值 小 ,将 其 值 赋 给 q 的 数据 域 
Pb = pb 一 > next; //B 表 中 指针 pb 后 移 
} 
else 
{ 
q-> data= pa— > data; // 否 则 ,将 A 表 结 点 的 值 赋 给 q 的 数据 域 
pa= pa 一 > next; // 人 AR 表 中 指针 pa 后 移 
} 
p->next=q; // 将 q 接 在 p 的 后 面 
p=qg; //p 始终 指向 C 表 当前 尾 结 点 
} 
while( pa) // 车 表 A 比 表 B 长 ,将 表 A 余 下 的 结 点 链 在 C 表 尾 


{ 
q= (Lnode* )malloc( sizeof(Lnode)); 
q->data= pa—> data; 
pa= pa—> next; 
p->next=q; 
p=q; 
} 
while(pb) // 车 表 B 比 表 A 长 ,将 B 余 下 的 结 点 链 在 C 表 尾 
{ 
q= (Lnode* )malloc( sizeof(Lnode)); 
q->data= pb— > data; 
Pb = pb 一 > next; 
p->next=q; 
p=q; 
} 
p-> next= NULL; 
return (pc); 
} 


此 算法 的 时 间 复 杂 度 为 OCm 十 n) ,其 中 mn 分 别 是 两 个 被 归并 表 的 表 长 。 

例 2.4 多 项 式 相 加 。 

多 项 式 的 算术 运算 ,是 线性 表 处 理 的 一 个 经 典 问 题 。 通 常 一 个 一 元 多 项 式 P, (x ) 可 按 
升 短 写成 


P,(z)=po 二 Piz 二 por 二 十 px” 
它 由 十 1 个 系数 唯一 确定 。 因 此 , 它 可 用 一 个 线性 表 P 来 表示 : 
P=(po,pi,p2s ,ps) 
每 一 项 的 指数 i 隐 含 在 其 系数 p; 的 序号 里 。 
车 Q,, (x) 是 一 元 多 项 式 , 也 可 用 线性 表 Q 来 表示 : 
@Q 一 (goyqliygs，… qu) 
两 个 多 项 式 相 加 的 结果 R(z) 二 P, (x) 十 Q, (x) 可 用 线性 表 R 表示 。 假 设 mw 二 n, 则 
R=(potgqgospit qispst qs pnt qn pms» pn) 
对 应 于 线性 表 的 两 种 存储 结构 ,前 面 定义 的 一 元 多 项 式 也 可 以 采用 两 种 存储 结构 来 表 
示 。 若 只 对 多 项 式 进行 “ 求 值 ” 等 而 不 改变 多 项 式 的 系数 和 指数 的 运算 , 则 采用 类 似 于 顺序 
表 的 顺序 存储 结构 即 可 ,否则 应 采用 链 式 存储 表示 。 下 面 利用 线性 链表 的 基本 操作 来 实现 
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一 元 多 项 式 的 求 和 运算 。 
一 个 一 元 多 项 式 用 一 个 带头 结 点 的 单 链表 来 表示 ,每 个 结 点 表示 多 项 式 的 一 项 ,由 3 个 
域 组 成 : 系数 域 .指数 域 . 指 针 域 。 结 点 类 型 定义 如 下 : 
typedef struct node 
{ 
int coef, exp; 
struct node * next; 
}Lnode; 


其 中 ,coef 为 系数 域 ; exp 为 指数 域 ; Lnode 为 结 点 类 型 名 。 


假设 有 多 项 式 A(z) 王 8 十 7z 一 9zs 十 5z7 ,BCz) 一 4z 十 6z7 十 9zs 一 10z8 ,用 ha、hb 
表示 表 头 指针 ,它们 的 链 式 表 示 如 图 2. 19 所 示 。 


ha 一 一 下 -1 一 -|s]。 -一 7 | 1 一 一 | -9 | 8 一 -LT 


mm 一 -人 > 一 一 4 | 1 | 6 | 7 广 -一 ”9 | 8 广 -一 一 10| 19 | 和 人 


图 2.19 多 项 式 的 链 式 表示 


一 元 多 项 式 相 加 的 运算 规则 是 : 两 个 多 项 式 中 所 有 指数 相同 的 项 ,对 应 系数 相 加 , 若 和 
不 为 零 , 则 生成 “和 多 项 式 ” 中 的 一 项 ; 对 于 指数 不 相同 的 项 均 复 制 到 “和 多 项 式 * 中 。 

现 具体 讨论 将 多 项 式 BCz) 加 到 多 项 式 A(Cz) 上 的 方法 。 为 了 扫描 多 项 式 链表 , 设 工 作 
指针 p 和 g 分 别 指 向 多 项 式 A(z) 和 B(xz) 中 当前 被 搜索 的 结 点 。 比 较 结 点 的 指数 项 ,有 以 
下 3 种 情况 。 

(1) p 一 > exp 一 qd 一 > exp: p 结 点 是 和 多 项 式 中 的 一 项 ,p 后 移 ,q 不 动 。 

(2) p 一 > exp 二 q 一 > exp: q 结 点 是 和 多 项 式 中 的 一 项 ,将 q 搬 在 p 之 前 ,q 后 移 ,p 不 动 。 

(3) p 一 > exp 王 一 q 一 > exp: 系数 相 加 ,如 果 系数 和 为 0, 从 A 表 中 删 去 pb, 释放 结 点 p 
和 结 点 q, 并 将 pq 指针 后 移 ; 若 系数 和 不 为 0, 修改 结 点 p 的 系数 域 ,释放 结 点 q, 并 将 p、q 
指针 后 移 。 

若 q 二 二 NULL, 合 并 结束 ; 车 p 二 二 NULL; 则 将 B(z) 中 剩余 部 分 连 到 A(z) 上 即 可 。 

算法 2.19 一 元 多 项 式 相 加 算法 。 


// 对 两 个 一 元 多 项 式 ha 和 hb 相 加 ,结果 由 ha 代 出 
void add poly(Lnode * pa,Lnode * pb) 
{ Lnode x*xp,*q, *u,*pre; 
int x; 
p= pa—> next; 
q= pb 一 > next; 
pre= pa; 
while( (p!= NULL) && (q!= NULL)) 
{ 
if(p—-> exp<q—> exp) 
{ 
pre=p; 
PD=p— >Wexty 


} 
else 
if(p—-> exp== q-> exp) 
{ 
x=p->coef+q—>coef; 
if(x!= 0) 
{p->coef=xi pre=p;} 
else 
{ pre 一 > next=p 一 > next; free(p);} 
p= pre 一 > next; 
u=q; 
q=q->next; 
free(u); 
} 


else 


u=q->next;q— > next= p;pre~— > next=q; 


Ppre=q; q=u; 


if(q!= NULL) 
pre 一 > next= q; 
free(pb); 
} 


本 例 中 “和 多 项 式 ”he 的 链表 如 图 2. 20 所 示 。 


ke 一 -> 广 -一 ”3 | 0 广 一 一 11| 1 j 5 |17 ] 


| 6[7| 10|19| 信 


图 2.20 A(z) 和 B(x) 相 加 后 得 到 的 和 多 项 式 的 链表 


Cs C++ 中 的 线性 表 


本 节 运 用 C++ 的 类 及 模板 类 的 概念 ,对 线性 表 进行 了 定义 ,并 给 出 了 一 些 应 用 的 示例 。 
2.5.1 C++ 中 线性 表 抽 象 数据 类 型 


借助 Ct+ 的 模板 抽象 类 来 定义 线性 表 抽象 数据 类 型 linearlist, 它 作为 顺序 表 类 和 链表 
类 的 基 类 。 例 2. 5 给 出 了 线性 表 抽 象 类 linearlist 的 规范 ,保存 在 头 文件 linearlist. h 中 。 

例 2.5 线性 表 。 

# include < iostream.h> 

template <class T> 


class linearlist 


. 
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public: 


virtual bool isempty() const = 0; 
virtual int length() const = 0; 


Virtual bool find(int i,T& x) const = 0; 


virtual int search(T x) const = 0; 
Virtual bool insert(int i,T x) = 0; 
Virtual bool deletel( int i) = 0; 
Virtual bool update( int i,T x) = 0; 


virtual void output(ostream& out) const = 0; 


protected: 
int n; 


}; 


2.5.2 ”C++ 中 线性 表 的 顺序 存储 


由 于 C++ 中 的 一 维 数组 在 内 存 中 占用 了 一 组 地 址 连续 的 存储 单元 ,因此 可 以 用 C++ 中 
一 维 数 组 来 描述 顺序 表 的 存储 结构 ,并 实现 顺序 表 类 。 例 2. 6 是 顺序 表 类 seqlist 的 定义 及 
其 实现 ,存放 在 头 文件 seqlist. h 中 ,该 类 继承 了 线性 表 抽 象 类 linearlist。 


例 2.6 顺序 表 类 。 


# include "linearlist.h" 
template <class T> 


class seqlist:public linearlist <T> 


public: 
seqlist(int msize); 


一 seqlist(){delete [] elements;} 


bool isempty() const; 
int length() const; 


bool find(int i,T& x) const; 


int search(T x) const; 
bool insert(int i,T x); 
bool deletel( int i); 
bool update(int i,T x); 


void output (ostream& out) const; 


protected: 
int maxlength; 
T * elements; 


}; 


template <class T> 


seqlist <T>::seqlist (int msize) 


{ 
maxlength = msize; 
elements = new T[maxlength]; 
n=0; 

} 


template <class T> 


bool seqlist <T>::isempty() const 


// 在 x 中 返回 表 中 下 标 为 i 的 元 素 
// 返 回 x 在 表 中 的 下 标 


// 将 下 标 为 i 的 元 素 修 改 为 x 


// 顺 序 表 的 最 大 长 度 
// 动 态 一 维 数组 的 指针 


// 动 态 分 配 顺序 表 的 存储 空间 


return n== 0; 
} 
template < class T> 
int seqlist <T>::length() const 
| 
return n; 
} 
template <class T> 
bool seqlist <T>::find(int i,T& x) const 
{ 
if (i<1||i>n) { 
cout <<"out of bounds"<< endl; 
return false; 
} 
x= elements[i-1]; 
return true; 
} 
template <class T> 
int seqlist <T>::search(T x) const 
for (int j=0;j<n;j++) 
if (elements[j] == x) return j+1; 
return 0; 
j 
template < Class T> 
bool seqlist <T>::insert(int i,T x) 
{ 
二 (< D+ 
cout <<"out of bounds"<< endl; 
return false; 
. 
if (n== maxlength){ 
cout <<"overflow"<< endl; 
return false; 
} 
for (int j=n-1;j>=1-1;j--) 
elements[j+1] = elements[j]; 
elements[i—1]=x; 
nt+; 
return true; 
4 
template < class T> 
bool seqlist <T>::delet(int i) 
{ 
if (!n){ 
cout <<"underflow"<< endl; 
return false; 
} 
if (i<1||i>n) { 
cout <<"out of bounds"<< end] ; 
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A 


return false; 
} 
for (int j= i;j<n;j++) 
elements[j 一 1] = elements[j]; 
ha 
return true; 
} 
template <class T> 
bool seqlist <T>::update(int i,T x) 
i 
if (i<1||i>n) { 
cout <<"out of bounds"<< endl; 
return false; 
} 
elements[i—1]=x; 
return true; 
} 
template <class T> 
void seqlist <T>::output(ostream& out) const 
{ 
for (int i=0;i<n;i++) 
out << elements[ i]<<' 
out << endl; 


} 
例 2.7 用 顺序 表 类 seqlist 实现 集合 “并 ”运算 。 


// 实 现 集合 "并 "运算 , 放 入 头 文件 seqlisttu.h 中 
# include "seqlist.h" 
template <class T> 
void Union(seqlist <T> &la, seqlist <T> 1b) 
{ 
TR; 
for (int i=1;i<= 1b. length();i++){ 
1b. find(i, x); 
if (la. search(x) == 0) 
la. insert(la. length() +1,x); 


’ 


} 

例 2.8 编写 验证 集合 “ 交 ” 运 算 的 程序 。 

主 程序 中 ,首先 定义 两 个 最 多 存放 20 个 元 素 的 顺序 表 对 象 la 和 lb, 通过 顺序 表 的 
insert() 函数 逐个 插入 元 素 形 成 两 个 集合 ; 再 用 Union() 函数 实 现 两 个 集合 求 并 ,最 终结 果 
存 和 人 la 中; 最 后 用 output() 函 数 将 结果 输出 。 


# include "seqlistu. h" 

const int size= 20; 

void main() 

4 
seqlist < int > la(size); 
seqlist < int > lb(size); 
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for (int i=1;i<=5;it+) 
la. insert(i,i); 

la.output(cout); 

for (i=6;i<=10;it+) 
1b. insert(i— 5,1i); 

1b. insert(1,0); 

1b. insert(3,2); 

1b. insert(1b. length( ), 4); 

1b. output (cout); 

Union( 1a, 1b); 

la. output (cout); 


2.5.3 ”C++ 中 线性 表 的 链 式 存储 


用 C++ 实现 线性 表 的 链 式 存储 时 ,首先 应 声明 一 个 结 点 类 node, 它 包含 结 点 的 数据 域 
data 和 指向 后 继 结 点 的 指针 域 next。 再 声明 一 个 单 链表 类 singlelist, 它 是 结 点 类 的 友 元 ， 
可 以 访问 node 类 中 的 私有 成 员 。 单 链表 类 同 顺序 表 类 一 样 继承 了 线性 表 类 linearlist。 单 
链表 类 singlelist 的 定义 和 实现 见 例 2. 9, 并 存 入 头 文件 singlelist. h 中 。 

例 2.9 结 点 类 和 单 链表 类 。 


# include "linearlist.h" 
template < class T> class singlelist; 
template <class T> 
class node 
{ 
private: 
T data; 
node<T> * next; 
friend class singlelist <T>; 
}; 
template <class T> 
class singlelist:public linearlist <T> 
{ 
public: 
singlelist(){head = NULL;n = 0;} 
~singlelist(); 
bool isempty() const; 
int length() const; 
bool find(int i,T& x) const; 
int search(T x) const; 
bool insert(int i,T x); 
bool deletel( int i); 
bool update( int i,T x); 
void clear(); 
void output (ostream& out) const; 
protected: 
node<T>* head; 


}; 
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template < class T> 
singlelist <T>::~singlelist() 
{ 
node<T> x*p; 
while (head){ 
p= head— > next; 
delete head; 
head = p; 


} 
template <class T> 
bool singlelist <T>::isempty() const 


returnn 
} 
template <class T> 

int singlelist <T>::length() const 


return n; 
} 
template <class T> 

bool singlelist <T>::find(int i,T& x) const 


if (i<0||i>n-1){ 
cout <<"out of bounds"<< end]; 
return false; 
} 
node<T> *p= head; 
for(int j=0;j<i;j++) 
p=p->next; 
x=p-> data; 
return true; 
} 
template <class T> 
int singlelist <T>::search(T x) const 
| 
node<T> x*p= head; 
for(int j= 0;pg&p—> data!= x;j++) 
p=p->next; 
if (p) return j; 
return —1; 
} 
template <class T> 
bool singlelist <T>::insert(int i,T x) 
{ 
if (i<-1||i>n-1){ 
cout <<"out of bounds"<< endl; 
return false; 
} 
node<T> x*q= new node<T>; 
q->data= x; 


node<T> x*p= head; 

for(int j=0;j<i;j++) 
p=p-> next; 

(i>=1){ 
q->next=p->next; 
p->next=q; 

} 

else{ 
q -> next = head; 
head = q; 

} 

nt+; 


return true; 


template <class T> 
bool singlelist <T>::delete( int i) 


{ 


} 


if (!n){ 
cout <<"underflow"<< endl; 
return false; 

} 

if (i<0||i>n-1){ 
cout <<"out of bounds"<< end]; 
return false; 

} 

node<T> *q= head, * p= head; 

for(int j=0;j<i-1;j+t+) 
p=p->next; 

if (i==0) 
head = head — > next; 

else{ 
p=q->next; 
q->next=p->next; 

} 

delete p; 

ni; 


return true; 


template <class T> 


bool singlelist <T>::updatel( int i,T x) 


{ 


if (i<olli>n-1){ 
cout <<"out of bounds"<< endl; 
return false; 

} 

node<T> *p= head; 

for(int j= 0;j<i;j++) 
p=p-> next; 

p->data= x; 

return true; 
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template <class T> 
void singlelist <T>: :output(ostreamg out) const 
{ 
node<T> *p= head; 
while (p){ 
out <<p—> data << 
p=p->next; 


} 


out << endl; 


} 
例 2.10 用 单 链表 类 singlelist 实现 集合 求 交 算法 程序 , 放 入 头 文件 singlelist. h 中 。 


# include "singlelist.h" 
template <class T> 
void intersction(singlelist <T> &la singlelist <T> &1b) 
{ 
于 到 
int i=0; 
while (i<1a.1length()){ 
la. find(i, x); 
if (1b. search(x) == -1) la. delete(i); 
else i++; 


上 
例 2.11 编写 主 函 数 ,验证 例 2. 10 的 算法 。 


# include "singlelist.h" 
void main() 
{ 
singlelist < int > la; 
singlelist < int > lb; 
for (int i=1;i<=5;it+) 
la. insert(i, i); 
la. output (cout); 
for (i=6;i<=10;i++) 
1b. insert(i— 5,i); 
1b. insert(1,0); 
1b. insert(3,2); 
1b. insert(1b. length( ), 4); 
1b. output (cout); 
Union( 1a, 1b); 
la. output(cout); 


名 题 2 


1. 描述 以 下 4 个 概念 的 区 别 : 头 指针 变量 、 头 指针 、 头 结 点 、 首 结 点 (第 一 个 结 点 )。 
2. 简 述 线性 表 的 两 种 存储 结构 的 主要 优 缺 点 及 各 自 使 用 的 场合 。 
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3. 设计 一 个 算法 ,在 头 结 点 为 h 的 单 链表 中 ,把 值 为 b 的 结 点 s 插入 到 值 为 a 的 结 点 
之 前 , 若 不 存在 a, 则 把 结 点 s 插入 到 表 尾 。 

4. 设计 一 个 算法 ,将 一 个 带头 结 点 的 单 链表 A 分 解 成 两 个 带头 结 点 的 单 链表 B 和 C， 
使 B 中 含有 原 链表 中 序号 为 奇数 的 元 素 , 而 C 中 含有 原 链表 中 序号 为 偶数 的 元 素 , 并 且 保 
持 元 素 原 有 的 相对 顺序 。 

5. 设 线性 表 中 的 数据 元 素 是 按 值 非 递 减 有 序 排列 的 , 试 以 顺序 表 和 单 链表 不 同 的 存储 
结构 ,编写 一 个 算法 ,将 x 插入 到 线性 表 的 适当 位 置 上 ,以 保持 线性 表 的 有 序 性 。 

6. 假设 A 和 B 分 别 表示 两 个 递增 有 序 排列 的 线性 表 集 合 ( 即 同一 表 集 合 中 元 素 值 各 
不 相同 ), 求 A 和 B 的 交集 C,C 中 也 依 值 递增 有 序 排列 。 试 分 别 用 顺序 表 和 单 链 表 两 种 不 
同 的 存储 结构 编写 求 得 表 集合 C 的 算法 。 

7. 设计 一 个 算法 , 求 两 个 递增 有 序 排 列 的 线性 表 集 合 A 和 B 的 差 集 (每 个 线性 表 中 不 
存在 重复 的 元 素 ), 试 以 顺序 表 和 单 链表 两 种 不 同 的 存储 结构 分 别 编写 算法 。 

提示 : 即 在 A 中 而 不 在 B 中 的 结 点 的 集合 。 

8. 设 有 线性 表 集 合 A 一 (oliyas, am),B 王 (5b1,0,,…,0,)。 试 写 一 合并 A、B 为 线 
性 表 集 合 C 的 算法 ,使 得 


人 
C= 
(BDL 


要 求 : A、B 和 C 均 以 单 链表 作为 存储 结构 , 且 C 利用 A 和 B 中 的 结 点 空间 。 

9. 试用 两 种 线性 表 的 存储 结构 来 解决 约瑟夫 问题 。 设 有 nn 个 人 围 坐 在 圆桌 周围 , 现 从 
第 s 个 人 开始 报 数 , 数 到 第 m 个 人 出 列 , 然 后 从 出 列 的 下 一 个 人 重新 开始 报 数 , 数 到 第 m 个 
人 又 出 列 …… 如 此 重复 ,直到 所 有 的 人 全 部 出 列 为 止 ,出 列 序列 即 为 约瑟夫 问题 结果 。 例 
如 , 当 n 二 8,m 二 4,s 二 1, 得 到 的 新 序列 为 : 4,8,5,2,1,3,7,6, 写 出 相应 的 求解 算法 。 

10. 已 知 单 链表 中 的 数据 元 素 含有 3 类 字符 ( 即 字母 字符 ,数字 字符 和 其 他 字符 ) , 试 编 
写 算法 构造 3 个 单 循 环 链表 .使 每 个 单 循 环 链表 中 只 含 同 一 类 的 字符 , 且 利 用 原 表 中 的 结 点 
空间 作为 这 3 个 表 的 结 点 空间 , 头 结 点 可 另 辟 空 间 。 

11. 假设 有 一 个 循环 链表 的 长 度 大 于 1, 且 表 中 既 无 头 结 点 也 无 头 指针 。 已 知 p 为 指向 
链表 中 某 结 点 的 指针 , 试 编写 算法 在 链表 中 删除 结 点 p 的 前 驱 结 点 。 

12. 假设 有 一 个 单 向 循环 链表 ,其 结 点 含 3 个 域 : pre、data 和 next, 每 个 结 点 的 pre 值 
为 空 指针 , 试 编写 算法 将 此 链表 改 为 双向 循环 链表 。 

分 析 : 在 遍历 单 链表 时 ,可 以 利用 指针 记录 当前 访问 结 点 和 其 前 驱 结 点 。 知 道 了 当前 
访问 结 点 的 前 驱 结 点 位 置 ,就 可 以 给 当前 访问 结 点 的 前 驱 指 针 赋 值 。 这 样 在 遍历 了 整个 链 
表 后 ,所 有 结 点 的 前 驱 指针 均 得 到 赋值 。 


(上 机 练习 2 
1. 设计 一 个 程序 ,生成 两 个 按 值 非 递减 有 序 排列 的 线性 表 LA 和 LB, 再 将 LA 和 LB 


归并 为 一 个 新 的 线性 表 LC, 且 LC 中 的 数据 仍 按 值 非 递减 有 序 排列 ,输出 线性 表 LA、 
LB、LC。 
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2. 生成 两 个 多 项 式 PA 和 PB, 求 PA 和 PB 之 和 ,输出 “和 多 项 式 ”。 

3. 设计 一 个 统计 选票 的 算法 ,输出 每 个 候选 的 得 票 结果 (假设 采用 单 链表 存放 选票 , 候 
选 人 编号 依次 为 1,2,…,N , 且 每 张 选票 选 且 只 选 一 人 )。 

提示 : 以 单 链表 存放 选票 ,每 个 结 点 的 data 域 存放 该 选票 所 选 的 候选 人 ,用 一 个 数组 a 
统计 得 票 结果 。 

4. 编写 一 算法 来 解决 约瑟夫 问题 。 设 有 7 个 人 围 坐 在 圆桌 周围 , 现 从 第 ; 个 人 开始 报 
数 , 数 到 第 mm 个 人 出 列 , 然 后 从 出 列 的 下 一 个 人 重新 开始 报 数 , 数 到 第 mm 个 人 又 出 列 …… 
如 此 重复 ,直到 所 有 的 人 全 部 出 列 为 止 , 例 如 当 n 二 8,m 二 4,s 二 1, 得 到 的 新 序列 为 : 4,8,5， 
Dl dT 

5. 设计 一 个 算法 , 求 A 和 B 两 个 单 链 表 表示 的 集合 的 交集 、 并 集 、 差 集 。 
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本 章 学 习 要 点 

(1) 掌握 栈 和 队列 这 两 种 数据 结构 的 特点 ,了 解 在 什么 问题 中 应 该 使 用 哪 种 结构 。 

(2) 熟悉 栈 ( 队 列 ) 和 线性 表 的 关系 、 顺 序 栈 ( 顺 序 队 列 ) 和 顺序 表 的 关系 、 链 栈 ( 链 队列 ) 
和 链表 的 关系 。 

(3) 重点 掌握 在 顺序 栈 和 链 栈 上 实现 的 栈 的 7 种 基本 运算 ,特别 注意 栈 满 和 栈 空 的 条 
件 及 它们 的 描述 。 

(4) 重点 掌握 在 循环 队列 和 链 队 列 上 实现 的 7 种 基本 运算 ,应 特别 注意 队 满 和 队 空 的 
描述 方法 。 

(5) 熟悉 栈 和 队列 的 下 溢 和 上 滋 的 概念 ; 顺序 队列 中 产生 假 上 游 的 原因 ; 循环 队列 消 
除 假 上 溢 的 方法 。 

(6) 了 解 递归 算法 执行 过 程 中 工作 记录 的 变化 情况 。 

栈 和 队列 与 线性 表 有 着 密切 的 联系 ,一 方面 , 栈 和 队列 的 逻辑 结构 也 是 线性 结构 ; 另 一 
方面 , 栈 和 队列 的 基本 操作 是 线性 表 操作 的 子 集 , 因 此 ,可 将 栈 和 队列 看 成 两 种 特殊 的 线 


性 表 。 
5 

3.1.1 栈 的 基本 概念 

日 常生 活 中 有 不 少 类 似 于 栈 ( 如 图 3. 1(a) 所 示 ) 的 例子 。 假 设 有 一 个 很 窗 的 死胡同 ,其 
宽度 只 能 容纳 一 辆 车 , 现 有 5 辆 车 ,分 别 编号 为 一 @ , 按 编号 顺序 依次 进入 此 胡同 , 若 要 退 
出 由 ,必须 先 退出 @@; 若 要 退出 四 必须 将 加 . 田 .@ 、`@ 依 次 都 退出 才 行 。 这 个 死胡同 就 是 一 
个 栈 ,如 图 3. 1(b) 所 示 。 

栈 (stack) 是 允许 仅 在 表 的 一 端 进行 插入 和 删除 操作 的 线性 表 。 人 允许 进行 插入 和 删除 
的 一 端 称 为 栈 顶 (top) ,不 允许 插入 和 删除 的 一 端 称 为 栈 底 (bottom) 。 不 含 元 素 的 空 表 称 为 
空 栈 。 

假设 栈 S= 一 (ai az,…:av), 如 图 3.1(a) 所 示 ,a; 为 栈 底 元 素 ,a。 为 栈 顶 元 素 。 栈 中 元 


素 按 cl ,as，… ,a 的 次 序 进 栈 , 退 栈 的 第 一 个 元 素 应 为 栈 顶 元 素 。 也 就 是 说 , 栈 的 特点 是 
后 进 先 出 (last in first out,LIFO) .因此 . 栈 又 称 为 后 进 先 出 的 线性 表 , 简 称 LIFO 线性 表 。 
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om | 
栈 底 一 = 4 一 
(a) 栈 的 示例 (b) 胡同 及 车 示例 


图 3.1 栈 及 其 示例 


在 已 知 栈 的 逻辑 结构 和 确定 常用 运算 后 ,就 可 以 定义 栈 的 抽象 数据 类 型 。 
ADT3. 1 是 栈 的 抽象 数据 类 型 描述 ,其 中 包含 最 常见 的 栈 运算 。 

ADT3.1 栈 ADT 

ADT stack! 

数据 对 象 : 

DD={a;|a;E 元 素 集合 ,i 二 1,2,*… ,n,n 宇 0} 

数据 关系 : 

Ri 二 {(ai_1vyai)|ai_iyai; ED,i 二 2,…,n) ,约定 a, 端 为 栈 顶 ,a, 为 栈 底 。 
基本 操作 : 

InitStack(): 创建 一 个 空 栈 。 

Destroy() : 撤销 一 个 栈 。 

StackEmpty() : 若 栈 空 , 则 返回 1 ,否则 返回 0。 

StackFull0) : 若 栈 满 , 则 返回 1 ,否则 返回 0。 

Top(x): 在 x 中 返回 栈 顶 元 素 。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 
Push() : 在 栈 顶 插入 元 素 x( 人 栈 )。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 
Pop() : 从 栈 中 删除 栈 顶 元 素 ( 出 栈 ) 。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 
Clear() : 清除 栈 中 全 部 元 素 。 

}ADT stack 

栈 的 应 用 非常 广泛 ,例如 进位 记 数 制 之 间 的 转换 间 | ，。 epg 


题 。 在 将 十 进 制 数 转换 成 二 进 制 数 时 , 常 采 用 除法 。 用 [7 …… 1 
初始 十 进 制 数 除 以 2, 把 余数 记录 下 来 , 若 商 不 为 0, 则 再 


用 商 去 除 以 2, 直 到 商 为 0, 这 时 把 所 有 的 余数 按 出 现 的 

逆序 排列 起 来 ( 先 出 现 的 余数 排 在 后 面 , 后 出 现 的 余数 二 1 

排 在 前 面 ) 就 得 到 了 相应 的 二 进 制 数 。 例 如 把 十 进 制 数 0 

35 转换 成 二 进 制 数 的 过 程 如 图 3. 2 所 示 。 图 3.2 十进制 数 35 转换 成 


根据 上 述 操作 的 描述 ,可 以 采用 一 个 栈 来 保存 所 有 二 进 制 数 的 过 程 
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的 余数 , 当 商 为 0 时 让 栈 中 的 所 有 余数 出 栈 ,这 样 就 得 到 了 正确 的 二 进 制 数 。 
算法 3.1 十 进 制 数 转换 成 二 进 制 数 算法 。 


void conversion() 
{ 
Stack S; 
int n; 
InitStack(&S); 
printf("Input a number to convert:\n"); 
scanf("%d",g&n); 
if(n<0) 


printf("\nThe number must be over 0."); 
return 0; 


if(n== 0) Push(&S, 0); 
while(n!= 0) 


Push(&S,n % 2); 
n=n/2; 


printf("the result is: "); 
while(!StackEmpty( &S)) 


printf(" %d", Pop(&S)); 


} 


3.1.2 栈 的 顺序 存储 结构 


由 栈 的 定义 以 及 栈 的 实例 ,很 容易 想到 用 数组 或 类 似 的 结构 去 存储 它 。 栈 的 顺序 存储 
结构 简称 顺序 栈 (sequential stack) 。 顺 序 栈 利用 一 组 地 址 连续 的 存储 单元 依次 存放 从 栈 底 
到 栈 顶 的 数据 元 素 , 通 常用 一 维 数组 存放 栈 的 元 素 , 同 时 设 “ 指 针 ”top 指示 栈 顶 元 素 的 当前 
位 置 。 注 意 ,top 并 不 是 指针 型 变量 ,只 是 整 型 变量 , 它 指示 栈 项 元 素 在 数组 中 的 位 置 , 空 栈 
的 top 值 为 零 。 

在 C 语言 中 ,顺序 栈 的 类 型 说 明 如 下 : 

#define maxsize < 栈 可 能 的 最 大 数据 元 素 的 数目 > // 栈 的 最 大 容量 

typedef struct 

elemtype elem[ maxsize]; 

int top; 

}sqstacktp; 

设 s 为 sqstacktp 型 变量 , 即 s 表示 一 个 顺序 栈 。 图 3. 3 说 明了 这 个 顺序 栈 的 几 种 状 
态 。 其 中 : 图 3. 3(a) 表 示 顺 序 栈 为 空 ,s. top 王 0; 图 3. 3(b) 表 示 栈 中 只 含 一 个 元 素 A， 
s. top 一 1, 在 图 3. 3(a) 的 基础 上 用 进 栈 操作 Push(s,A) 可 以 得 到 这 种 状态 ; 图 3. 3(c) 表 示 
在 图 3. 3(b) 的 基础 上 将 元 素 B.C 依次 进 栈 后 的 状态 ,s. top 一 3; 图 3. 3(d) 表 示 在 图 3. 3(c) 
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状态 下 将 元 素 C 退 栈 后 的 情况 ,s. top 二 2, 由 执行 一 次 Pop(s) 得 到 ; 图 3. 3(e) 表 示 栈 中 有 
5 个 元 素 ,s. top 一 maxsize, 这 种 状态 称 为 栈 满 ,此 时 车 有 元 素 进 栈 则 将 产生 “数组 越界 ”的 错 


top F 
top 于 
， C = D 
P| B B B 
top 
i A A A A 
(a) 栈 空 (b) 入 栈 1 个 元 素 的 栈 (c) 入 栈 2 个 元 素 的 栈 (d) 出 栈 1 个 元 素 (e) 栈 满 


图 3.3 顺序 栈 的 几 种 状态 


因此 ,s. top 二 0 表示 空 栈 ,出 栈 和 读 栈 顶 元 素 之 前 应 判断 栈 是 否 为 空 。 


表示 栈 满 , 进 栈 之 前 应 判断 是 否 栈 满 。 


下 面 讨 论 在 顺序 栈 上 实现 的 操作 。 
1. 初始 化 ( 栈 置 空 ) 操 作 
算法 3.2 顺序 栈 置 空 算法 。 


void InitStack( sqstacktp * s) 
{ 
// 将 顺序 栈 s 置 为 空 
s->top=0; 


} 
如 下 函数 生成 了 一 个 顺序 栈 , 并 完成 了 对 该 顺序 栈 的 初始 化 。 


void main() 
x 
void InitStack( sqstacktp * s); 
sqstacktp *s; 
s= (sqstacktp * )malloc(sizeof(sqstacktp)); 
InitStack(s); 


2. 判 栈 空 操作 
算法 3.3 ”顺序 栈 判 栈 空 算法 。 


int StackEmpty( sqstacktp * s) 
{ 
if(s->top>0) 
return 0; 
else 


return 1; 


s. top= maxsize 


3. 进 栈 操作 
算法 3.4 顺序 栈 进 栈 算法 。 


void Push( sqstacktp * s,elemtype x) 
{ 
// 若 栈 s 未 满 ,将 元 素 x 压 人 栈 中 ;否则 , 栈 的 状态 不 变 并 给 出 出 错 信息 
if(s 一 > top== maxsize) 
printf("Overflow"); 
else 
s—->elem[s—->topt+]=x; //x 进 栈 


4. 出 栈 操作 
算法 3.5 顺序 栈 出 栈 算法 。 


elemtype Pop(sqstacktp * s) 

{ 
// 若 栈 s 不 空 , 则 删 去 栈 顶 元 素 并 返回 元 素 值 , 否则 返回 空 元 素 NULL 
if(s->top==0) 


return NULL; 
else 
= // 栈 项 指针 减 1 
return s—> elem[s—-> top]; // 返 回 原 栈 顶 元 素 值 
} 
} 
5. 求 栈 深 操 作 


算法 3.6 顺序 栈 求 栈 深 算法 。 


int Size( sqstacktp * s) 
| 
return(s 一 > top); 


} 


6. 读 取 栈 项 元 素 操作 
算法 3.7 顺序 栈 读 取 栈 项 元 素 算法 。 


elemtype Top(sqstacktp * s) 
{ 
if(s->top==0) 
return NULL; 
else 


return(s—>elem[s—->top—1]); 
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顺序 栈 使 用 起 来 比较 简单 ,但 是 必须 预先 为 它 分 配 存储 空间 。 而 且 , 为 了 避免 栈 溢出 ， 
通常 必须 分 配 较 大 的 存储 空间 。 显 然 , 这 样 操作 在 大 多 数 时 候 都 会 造成 存储 空间 的 浪费 。 
但 是 当 在 程序 中 同时 使 用 两 个 栈 时 ,有 一 种 方法 可 以 提高 存储 空间 的 使 用 效率 : 将 两 个 栈 
的 栈 底 设 在 一 维 数组 空间 的 两 端 , 让 两 个 栈 各 自 向 中 间 延 伸 , 仅 当 两 个 栈 的 栈 顶 相遇 时 才 可 
能 发 生 上 溢 , 如 图 3.4 所 示 。 这 样 当 一 个 栈 里 的 元 素 较 多 ,超过 向 量 空间 的 一 半 时 ,只 要 另 


alblcla BIA 
opl1 | om 
图 3.4 ”两 个 栈 共享 空间 示意 图 


共享 空间 的 双 栈 结构 的 类 型 描述 如 下 : 


并 define maxsize < 栈 可 能 的 最 大 数据 元 素 的 数目 > 
typedef struct 
{ 
elemtype elem[ MAXSIZE]; 
int top[2]; 
}dustacktp 


若 ds 为 dustacktp 型 变量 ,显然 : 


// 栈 的 最 大 容量 


(1) 栈 1 的 顶 由 ds.top[L0] 指 示 ,ds. topL0]=0 表示 栈 1 为 空 。 
(2) 栈 2 的 顶 由 ds. top[1] 指 示 ,ds. top[1] 二 maxsize 一 1 表示 栈 2 为 空 。 


(3) ds. top[0j] 十 1 二 ds. top[1] 表 示 栈 满 。 


3.1.3 栈 的 链 式 存储 结构 


一 个 栈 的 元 素 不 多 ,那么 前 者 就 可 以 占用 后 者 
的 部 分 存储 空间 。 所 以 , 当 两 个 栈 共享 一 个 长 
度 为 maxsize 的 数组 空间 时 ,每 个 栈 实 际 可 利 
用 的 最 大 空间 大 于 maxsize/2。 


由 栈 的 顺序 存储 结构 可 知 ,顺序 栈 的 最 大 缺点 是 : 为 了 保证 不 溢出 ,必须 预先 为 栈 分 配 


一 个 较 大 的 空间 ,这 很 有 可 能 造成 存储 空间 的 浪费 ,而 且 
在 很 多 时 候 并 不 能 保证 所 分 配 的 空间 足够 使 用 。 这 些 缺 
陷 大 大 降低 了 顺序 栈 的 可 用 性 ,这 时 可 以 考虑 采用 栈 的 链 
式 存 储 结构 。 

栈 的 链 式 存储 结构 简称 链 栈 (linked stack) ,其 组 织 
形式 与 单 链表 类 似 , 链 表 的 尾部 结 点 是 栈 底 , 链 表 的 头 部 
结 点 是 栈 顶 。 由 于 只 在 链 栈 的 头 部 进行 操作 , 故 链 栈 没有 
必要 设置 头 结 点 。 如 图 3. 5 所 示 , 其 中 , 单 链表 的 头 指针 
head 作为 栈 项 指针 。 链 栈 由 栈 顶 指针 head 唯一 确定 , 栈 
底 结 点 的 next 域 为 NULL。 

链 栈 的 类 型 定义 如 下 : 

typedef struct stacknode 

: elemtype data; 

struct stacknode * next; 


}stacknode; 
typedef struct 


head 


data next 
= 
| 
| 
A NULL 


图 3.5 链 栈 示意 图 


栈 顶 


栈 底 
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{ 

stacknode * top; // 栈 顶 指 针 
}LinkStack; 
下 面 给 出 初始 化 、 进 栈 和 出 栈 操作 在 链 栈 上 的 实现 。 
1. 初始 化 操作 


算法 3.8 链 栈 初始 化 算法 。 


void InitStack(LinkStack * 1s) 
{ 

// 建 立 一 个 空 栈 1s 

1s -> top = NULL; 
} 


下 面 函 数 完成 了 对 一 个 链 栈 的 创建 和 初始 化 操作 。 


void main() 

上 
LinkStack * 1s; 
ls= (LinkStack * )malloc(sizeof(LinkStack)); 
InitStack(1s); 


2. 进 栈 操 作 
算法 3.9 链 栈 进 栈 算法 。 


void Push(LinkStack * 1s,elemtype x) 
{ 
stacknode * s= NULL; 


s= (stacknode * )malloc(sizeof(stacknode)); // 生 成 新 结 点 
s->data=x; 
s->next=1s 一 >top; // 链 入 新 结 点 
ls->top=s; // 修 改 栈 顶 指针 
} 
3. 出 栈 操作 


算法 3.10 链 栈 出 栈 算法 。 


elemtype Pop(LinkStack * 1s) 

{ 
// 若 栈 1s 不 空 , 删 去 栈 顶 元 素 并 返回 元 素 值 ,否则 返回 空 元 素 NULL 
stacknode * p= NULL; 


elemtype x; 

if(1s -> top== NULL) 
return NULL; 

else 


{ 
x= (ls—> top) -> data; 
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下 SR 

ls->top=p->next; 

free(p); 

return x; // 返 回 原 栈 顶 元 素 值 


} 


显然 , 链 栈 一 般 不 会 发 生 栈 满 ,只 有 当 整 个 可 用 空间 都 被 占 满 ,malloc() 函数 过 程 无 法 
实现 时 才 可 能 发 生 上 洲 。 
另外 , 链 栈 占 用 的 空间 是 动态 分 配 的 ,所 以 多 个 链 栈 可 以 共享 存储 区 域 。 


6.2 栈 的 应 用 实例 
》A 


栈 在 计算 机 科学 领域 具有 广泛 的 应 用 ,只 要 问题 满足 后 进 先 出 原则 , 均 可 使 用 栈 作为 其 
数据 结构 。 例 如 ,在 编译 和 运行 计算 机 高 级 语言 程序 的 过 程 中 ,需要 利用 栈 进行 语法 检查 
(如 检查 PASCAL 语言 中 begin 和 end、( 和 )、[ 和 j] 是 否 配对 等 ); 实现 递归 过 程 和 函数 的 调 
用 、 计 算 表达 式 的 值 时 需要 利用 栈 实 现 其 功能 。 


3.2.1 表达 式 求 值 


要 将 一 个 表达 式 翻 译 成 能 正确 求 值 的 机 器 指令 ,或 者 直接 对 表达 式 求 值 ,首先 要 能 正确 
解释 表达 式 。 例 如 ,对 下 面 的 算术 表达 式 求 值 
1+2*4—9/3 
必须 遵循 先 乘 除 后 加 减 、 先 左 后 右 及 先 括 号 内 后 括号 外 的 四 则 运算 法 则 ,其 计算 顺序 应 为 
和 古训 第 十 二 -33 
| | 
O © 


| 


@ 


LE 
@ 

那么 ,如 何 让 机 器 也 按照 这 样 的 规则 求 值 呢 ? 通常 采用 “运算 符 优先 数 法 ”。 

一 般 表达 式 中 会 遇 到 操作 数 .运算 符 和 表达 式 结束 符 ( 为 了 简化 问题 ,这 里 仅 讨 论 只 含 
加 \ 减 , 乘 、 除 4 种 运算 ,并 且 不 含 括 号 的 情况 )。 对 每 种 运算 符 赋予 一 个 优先 数 , 如 表 3. 1 所 
示 , 其 中 # 是 表达 式 结束 符 。 

表 3.1 运算 符 的 优先 数 
运算 符 x / 素 二 # 


京 
齐 


2 六 1 0 


对 表达 式 求 值 时 ,一 般 设立 两 个 栈 : 一 个 称 为 运算 符 栈 (OPTR); 另 一 个 称 为 操作 数 栈 
(OPND) ,以 便 分 别 存放 表达 式 中 的 运算 符 和 操作 数 。 
具体 处 理 方法 是 : 从 左 至 右 扫 描 表 达 式 。 
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(1) 凡 遇 操作 数 ,一 律 进 OPND 栈 。 

(2) 若 遇 运算 符 , 则 比较 它 与 OPTR 栈 的 栈 顶 元 素 的 优先 数 。 若 它 的 优先 数 大 , 则 将 
该 运算 符 进 OPTR 栈 ; 反之 , 则 弹出 OPTR 栈 顶 的 运算 符 0, 并 从 OPND 栈 连续 弹出 两 个 
栈 顶 元 素 y 和 x, 进行 运算 xby, 并 将 运算 结果 压 进 OPND 栈 。 

为 了 使 算法 简捷 ,在 表达 式 的 最 左边 也 虚设 一 个 # ,一 旦 左边 的 # 与 右边 的 # 相 遇 , 说 
明 表 达 式 求 值 结束 。 

算法 3.11 算术 表达 式 求 值 算法 。 

int precedence(char ch) // 求 运算 符 优先 数 

: int z=0; 

switch (ch) 


{ 
'+':z= 1;break; 


'—-':z= 1;break; 
'¥ ':Z= 2;break; 
'/':z= 2;break; 


'#':z= 0;break; 
default:printf("error! \n"); 
} 
return z; 
} 
int operate( int x, char ch, int y) // 进 行 二 元 运算 xby 
{ 
int z= 0; 
switch (ch) 
{ 
'+':zZ=x+y;break; 
'—-':z2= x- y;break; 
'¥%':Z= Xx*y;break; 
'/':z= x/y;break; 
default:printf("error! \n"); 
} 
return 2z; 
} 
operandtype exp_reduced( ) // 算 术 表 达 式 求 值 的 运算 符 优先 数 算法 ,假定 表达 式 无 语法 错误 
‘ 
char ch, theta; 
operandtype x,y, result; 
strcpy(op," +— * /#"); //op 为 运算 符 的 集合 


InitStack(OPTR); 

Push(OPTR, '# '); // 栈 初始 化 ,并 在 运算 符 栈 的 栈 底 压 人 表达 式 左 边 虚 设 的 字符 "#" 
InitStack(OPND); 

scanf(" % c",&ch); // 从 终端 读 入 一 个 字符 

while(ch!= ' 井 ' | | Top(OPTR)!= '#') 

{ 


if(!strchr(op, ch)) 
和. 
Push( OPND, ch) ; 
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ch = getchar(); 
} 
else if(precedence(ch)> precedence(Top(OPTR) ) ) // 比 较 优先 数 
{ 
Push(OPTR, ch) ; 
ch = getchar(); 
} 


else 
{ 

theta = Pop( OPTR); // 弹 出 栈 顶 运算 符 

y= Pop(OPND), x = Pop( OPND); // 连 续 弹出 两 个 操作 数 

result = operate(x, theta, y); // 进 行 运算 xby 

Push( OPND, result); // 将 运算 结果 压 和 人 操作 数 栈 

} 

} 
return( Top( OPND) ); // 从 操作 数 栈 顶 取出 表达 式 运算 结果 返回 


} 


上 述 算法 中 使 用 了 有 关 栈 的 基本 操作 的 若干 函数 ,另外 ,还 调用 了 两 个 函数 ,其 中 
precedence(w) 是 求 运算 符 优先 数 的 函数 ,operate(x,theta,y) 是 进行 二 元 运算 x0y 的 函数 。 

例 3.1 利用 算法 3.11, 写 出 对 算术 表达 式 1 十 2*4 一 9/3 求 值 的 操作 过 程 。 

利用 算法 3. 11 对 算术 表达 式 1 十 2* 4 一 9/3 求 值 的 操作 过 程 如 图 3.6 所 示 。 


步骤 OPTR 栈 OPND 栈 输入 字符 主要 操作 
1 # 1 十 2* 4 一 9/3 间 Push(OPND, '1') 
2 # 1 十 2 * 4 一 9/3 间 Push(OPTR, '+') 
3 # 十 1 2* 4 一 9/3 间 Push(OPND, '2') 
4 # 十 12 * 4 一 9/3 间 Push(OPTR,'* ') 
5 # 十 * 12 4 一 9/3# Push(OPND,'4') 
6 井 十 * 124 一 9/3# operate( '2',' x ','4') 
7 # 十 18 一 9/3# operate('1',' 十 ','8') 
8 # 9 一 9/3# Push(OPTR,'—') 
9 # 一 9 9/3 间 PushCOPND,'9) 
10 he 99 /3# Push(OPTR,'/') 
11 # 一 / 99 3# Push(OPND,'3') 
12 莫 二 993 # operate('9','/','3') 
13 和 9 3 # operate( '9','—','3') 
14 # 6 # return( Top(OPND)) 


图 3.6 算术 表达 式 1 十 2* 4 一 9/3 求 值 的 操作 过 程 


3.2.2 栈 与 函数 调用 


在 模块 化 程序 设计 的 思想 中 ,模块 (或 函数 ,过程 ) 是 功能 相对 独立 的 一 个 程序 段 , 在 主 
函数 ( 主 程序 ) 中 调用 模块 来 解决 复杂 的 实际 问题 。 由 于 函数 调用 后 ,需要 返回 调用 处 ,所 以 
在 调用 时 ,需要 用 栈 记录 断 点 的 地 址 以 及 有 关 信 息 ,以便 返 回 。 

函数 调用 的 执行 过 程 如 图 3.7 所 示 。 
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图 3.7 函数 调用 的 执行 过 程 


递归 调用 是 一 种 特殊 的 函数 调用 ,关于 栈 在 递归 调用 中 的 应 用 详 见 3.5 节 。 
3.2.3 栈 在 回溯 法 中 的 应 用 


在 某 些 问题 的 求解 过 程 中 常常 采用 试探 方法 , 当 某 一 路 径 受阻 时 ,需要 逆序 退回 ,重新 
选择 新 路 径 , 这 样 必须 用 栈 记录 曾经 到 达 的 每 一 状态 , 栈 顶 状态 即 是 回 退 的 第 一 站 ,例如 迷 
宫 问 题 ` 地 图 四 染色 问题 等 。 下 面 讨论 地 图 四 染色 问题 。 

四 染色 定理 : 可 以 用 不 多 于 四 种 颜色 对 地 图 着 色 ,使 相 邻 的 地 区 不 重 色 。 

算法 思想 : 回溯 法 。 

从 第 一 号 地 区 开始 逐一 染色 ,每 一 个 地 区 逐次 用 色 号 1.2、3、4 进行 试探 , 若 当 前 所 取 的 
色 号 与 周围 已 染色 的 地 区 不 重 色 , 则 用 栈 记 下 该 地 区 的 色 号 ,否则 依次 用 下 一 色 号 进行 试 
探 ; 若 试探 4 种 颜色 均 与 相 邻 地 区 发 生 重 色 , 则 需 退 栈 回溯 ,修改 当前 栈 顶 的 色 号 。 

数据 结构 : 

r[nj[nj: nxn 的 关系 和 矩阵,r[ 订 [jj] 二 0 表示 i 号 地 区 与 j 号 地 区 不 相 邻 ,r[ 订 [=1 表 
示 i 号 地 区 与 j 号 地 区 相 邻 。 

sLnj: 栈 的 顺序 存储 ,s[ 订 表示 第 i 号 地 区 的 染色 号 。 

在 下 述 算法 中 ,n 代表 地 区 号 .为 方便 描述 ,r 和 s 分 别 定义 如 下 : 


int r[n+1][n+1]; 
int s[n+1]; 


算法 3.12 地 图 四 染色 算法 。 


void mapcolor(int r[][n+1], int n, int s[]) //n 为 地 区 号 
{ 
int iv j,k; 
s[1] =1; //1 号 地 区 染 1 色 
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i=1; //i 为 地 区 号 ,j 为 染色 号 


while (i<=n) 


while ((j<=4)&&(i<=n)) 
{ 


k=1; //k 指示 一 个 染色 地 区 号 
while((k<i)gg(s[k] * r[i][k]!= j)) 

k++; 
if (k<i) 

j++; // 用 j+1 色 号 继续 试探 
else 


s[i]=j,itt+,j=1; 
// 若 不 与 相 邻 地 区 重 色 , 进 栈 记录 染色 结果 ,继续 对 下 一 地 区 从 1 色 号 起 试探 
} 
if(j> 4) 
= ol+ // 改 变 栈 顶 地 区 的 色 号 
} 
} 


3 队列 


日 常生 活 中 ,队列 的 例子 比比 缘 是 ,如 等 待 购物 的 顾客 总 是 按 先 来 后 到 的 次 序 排 成 队 
列 , 排 在 队 头 的 人 先 得 到 服务 ,后 到 的 人 总 是 排 在 队列 的 末尾 。 在 计算 机 系统 中 ,队列 的 应 
用 例子 也 很 多 ,例如 ,操作 系统 中 的 作业 排队 。 在 允许 多 道 程序 运行 的 计算 机 中 ,同时 有 几 
个 作业 运行 ,如 果 运 行 的 结果 都 要 输出 , 则 要 按 请 求 输出 的 先后 次 序 排 队 。 每 当 通 道 传输 完 
毕 , 可 以 接受 新 的 输出 任务 时 ,就 从 等 待 输出 的 队列 中 取出 队 头 的 作业 进行 输出 。 凡 是 申请 


输出 的 作业 都 从 队 尾 进入 队列 。 
3.3.1 队列 的 基本 概念 


队列 (queue) 是 只 允许 在 表 的 一 端 进 行 插入 ,在 表 的 另 一 端 进行 删除 的 线性 表 。 人 允许 插 
和 人 的 一 端 叫 作 队 尾 (rear) ,允许 删除 的 一 端 称 为 队 头 (front) ,不 含 元 素 的 队列 称 为 空 队 列 。 

假设 队列 为 gq 二 (a,b,c,….h,i,g) ,如 图 3.8 所 示 ,a 是 队 头 元 素 ,g 则 是 队 尾 元 素 。 队 
列 中 的 元 素 是 按照 a,b,c,…,h,i,g 的 顺序 进入 的 ,退出 队列 也 只 能 按照 这 个 次 序 依次 退 
出 ,也 就 是 说 ,只 有 在 a,b 离队 后 ,c 才能 退出 队列 , 同 理 a,b,c,…,h,i 都 离队 之 后 ,g 才能 
退出 队列 。 因 此 ,队列 的 特点 是 先进 先 出 (First In First Out, FIFO) ,队列 又 称 为 先进 先 出 


的 线性 表 , 简 称 FIFO 表 。 
ES b, c, :…,.h, i, g 一 进 队列 


一 一 > 
— 


队 头 队 尾 
图 3.8 队列 的 示意 图 
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在 已 知 队 列 的 逻辑 结构 和 确定 常用 运算 后 就 可 以 定义 队列 的 抽象 数据 类 型 。ADT3. 2 
是 队列 的 抽象 数据 类 型 描述 ,其 中 只 包含 最 常见 的 队列 运算 。 

ADT3.2 队列 ADT 

ADT queue! 

数据 对 象 : 

也 ={ailaiE 元 素 集合 性 一 1,2,… ,n,n 之 0} 

数据 关系 : 

及 = 一 ({(ai yai)la yaiED， 一 2,…，2)} ,约定 ai 为 队列 头 ,a, 端 为 队列 尾 。 

基本 操作 : 

InitQueue() : 创建 一 个 空 队列 。 

Destroy() : 撤销 一 个 队列 。 

QueueEmpty() : 若 队列 空 , 则 返回 1 ,否则 返回 0。 

QueueFull() : 若 队 列 满 , 则 返回 1 ,否则 返回 0。 

Front(x): 在 x 中 返回 队列 头 元 素 。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 

EnQueue() : 在 队列 尾 插入 元 素 x( 入 队 )。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 

DelQueue() : 从 队列 中 删除 队列 头 元 素 (出 队 )。 若 操作 成 功 , 则 返回 1 ,否则 返回 0。 

Clear() : 清除 队列 中 全 部 元 素 。 

}ADT queue 


3.3.2 队列 的 顺序 存储 结构 


队列 的 顺序 存储 结构 ,简称 顺序 队列 (sequential queue), 它 由 
一 个 存放 队列 元 素 的 一 维 数组 ,以 及 分 别 指示 队 头 和 队 尾 的 “指针 ” “ 刁 二 各 
所 组 成 。 通 常 约定 : 队 尾 指针 指示 队 尾 元 素 在 一 维 数组 中 的 当前 位 。 人 .| 
置 , 队 头 指针 指示 队 头 元 素 在 一 维 数组 中 当前 位 置 的 前 一 个 位 置 ， 队 闵 指针 上 
如 图 3.9 所 示 。 ~ 
顺序 队列 的 类 型 定义 如 下 : 图 3.9 顺序 队列 示意 图 


# define maxsize < 队列 可 能 的 最 大 长 度 > //maxsize 为 队列 可 能 达到 的 最 大 长 度 
typedef struct 
{ 

elemtype elem[ maxsize]; 

int front, rear; 


}squeuetp; 

假设 Sq 为 squeuetp 变量 , 即 Sq 表示 一 个 顺序 队列 ,入 队 操 作为 : 

Sq. rear = Sq. rear + 1; // 修 改 队 尾 指针 rear 

Sq. elem[ Sq. rear] = x; // 将 x 放 入 rear 所 指 位 置 


类 似 地 ,出 队列 需要 修改 队 头 指针 : 
Sq. front = Sq. front +1 


图 3. 10 说 明了 在 顺序 队列 上 按 上 述 方法 入 队 、 出 队 的 几 种 状态 。 
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图 3. 10(a) 为 空 队列 ,Sq. rear 一 一 1,Sq. front 一 一 1; 
图 3.10(b) 中 a,b,c,d,e 依次 入 队 后 ,Sq. rear 一 4,Sq. front 一 一 1; 
图 3.10(c) 中 a,b,c 依 次 出 队 后 ,Sq. rear 一 4,Sq. front 一 2。 


Sq.elem[4] Sq.rear e Sq.rear 本 

|. d d 
Soeleml3] Sq.front 
Sq.elem[2] 6 一 一 一 | 
Sq.elem[1] b 
Sq.elem[0] a 

Sq.rear Sq.front 

Sq.front 

(a) 队列 为 空 (b) 入 队 5 个 元 素 (9) 出 队 3 个 元 素 


图 3.10 顺序 队列 的 几 种 状态 


由 此 可 见 ,Sq. front 王 Sq. rear 表示 队列 空 。 但 是 队列 满 的 条 件 是 什么 呢 ? 

在 图 3. 10(b) 和 图 3. 10(c) 状 态 下 ,Sq. rear 王 maxsize, 显 然 按 上 述 方法 不 能 再 做 入 队 操 
作 。 然 而 在 图 3. 10(c) 状态 下 顺序 队列 的 存储 空间 并 没有 被 占 满 ,因此 这 是 一 种 假 溢 出 
现象 。 

为 了 克服 假 溢出 现象 ,一 个 巧妙 的 办 法 是 把 队 3 


列 设想 为 一 个 循环 的 表 , 设 想 Sq. elem[0] 接 在 网 

Sq. elem[maxsize 一 1] 之 后 。 这 种 存储 结构 称 为 特 A AL 

环 队列 。 利 用 取 余 运 算 (%) ,很 容易 实现 队 头 、 队 Zs 

尾 指针 在 循环 意义 下 的 加 1 操作。 循环 队 列 示意 [sew] LN tt 
2 


图 如 图 3. 11 所 示 。 
循环 队列 上 的 入 队 操 作为 : 0 


Sq. rear = (Sq. rear + 1) % maxsize; 
Sq. elem[Sq. rear] = xi 


出 队 操作 为 : 
Sq. front = (Sq. front + 1) % maxsize 


图 3. 12 说 明了 在 循环 队列 上 入 队 、 出 队 的 几 种 状态 ,其 中 : 

图 3.12(a) 为 空 队列 ,Sgq. rear 一 0,Sq. front 一 0; 

图 3.12(b) 中 A,B,C,D 依次 入 队 后 ,Sgq. rear 一 4,Sq. front 二 0; 

图 3.12(c) 中 A,B,C,D 依次 出 队 后 ,Sq. rear 二 4,Sq. front 二 4; 

图 3.12(d) 中 下 入 队 后 ,Sq. rear 二 5,Sgq. front 一 4; 

图 3.12(Ce) 中 下 入 队 ,Sq. rear 二 (Sq. rear 十 1) % maxsize 一 (5 十 1) %6 王 0,Sq. front 一 4; 

图 3.12(f) 中 G,H,I,J 依 次 入 队 后 ,Sq. rear 一 4,Sq. front 一 4。 

在 图 3. 12(a) 和 图 3. 12(c) 的 状态 下 ,队列 空 ,Sq. front 二 Sgq. rear; 在 图 3. 12(f) 的 状态 
下 ,队列 满 ,Sq. front 二 Sq. rear。 由 此 可 见 , 不 能 只 赁 等 式 Sq. front 二 Sq. rear 来 判定 循环 队 
列 的 状态 是 空 还 是 满 。 为 此 ,有 两 种 处 理 方法 : 第 一 种 , 另 设 一 个 标志 位 以 区 别 队列 是 空 还 
是 满 ; 第 二 种 ,约定 队 头 指针 指示 的 位 置 不 用 来 存放 元 素 , 这 样 当 队 尾 指针 “ 绕 一 圈 ”" 后 追 上 
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0 Sq.rear 


0 
一 |Sq.front 一 一 Sq.front 


© 1 
3 3 


2 
(8) 空 队列 (b) A，B，C，D 依 次 入 队 


9 1 Sq.rear 
4 4 
D 


5 5 Sq.rear 
Sqrear [= 0 Sq.front 4 0 
Sq.front 3 i 1 
2 2 
(c) A，B，C，D 依 次 出 队 (d)E 入 队 
Sq.front a 
oN 人 A 
Ke 
2 
(e) F 入 队 (DG，H, 1 J 依次 入 队 


图 3.12 ”循环 队列 的 几 种 状态 
队 头 指针 时 , 视 为 队 满 。 故 队 满 的 条 件 为 : 


(Sq.rear +1) $% maxsize= Sq.front 
显然 , 队 空 的 条 件 为 : 
Sq. front = Sq. rear 


在 此 采用 第 二 种 方法 。 因 此 .循环 队列 的 定义 为 : 


并 define maxsize < 为 队列 可 能 达到 的 最 大 长 度 > +1 
typedef struct 
: 
elemtype elem[ maxsize]; 
int front, rear; 
}cqueuetp; 


下 面 给 出 在 循环 队列 上 实现 的 操作 。 
1. 队列 的 初始 化 操作 

算法 3.13 循环 队列 初始 化 算法 。 
void InitQueue(cqueuetp * sq) 


{ 
// 设 置 sq 为 空 的 循环 队列 
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sq-> front =0; 
sq—> rear=0; 


} 
下 面 的 函数 实现 了 对 一 个 循环 队列 的 定义 和 初始 化 操作 。 


void main() 

{ 
cqueuetp * sq; 
sq= (cqueuetp * )malloc(sizeof(cqueuetp)); 
InitQueue( sq); 

} 


2. 判 队 空 操作 
算法 3. 14 循环 队列 判 队 空 算法 。 
int QueueEmpty(cqueuetp * sq) 
// 判 别 队列 sq 是 否 为 空 ; 若 为 空 则 返回 真 值 ,否则 返回 假 值 
if (sq—-> rear== Sq 一 > front) 
return 1; 


return 0; 


} 


3. 求 队 长 度 操作 

算法 3.15 求 循 环 队 列 长 度 算法 。 

int Size(cqueuetp * sq) 

| // 取 模 运算 的 被 除数 加 上 maxsize 是 考虑 sq 一 > rear - sg->front<0 的 情况 


return( (maxsize + sq 一 > rear — sq 一 > front) % maxsize) 


} 


4. 读 队 头 元 素 操 作 
算法 3.16 读 循环 队列 队 头 元 素 算法 。 


elemtype Head(cqueuetp * sq) 


' 
// 若 循环 队列 sq 不 空 , 则 返回 队 头 元 素 值 , 否则 返回 空 元 素 NULL 
if(sq—> front == sq 一 > rear) 
return NULL; 
else 
return( sq 一 > elem[ (sq 一 > front+1)%maxsize]); 
} 
5. 入 队 操 作 


算法 3.17 循环 队列 入 队 算法 。 


void EnQueue(cqueuetp * sq,elemtype x) 
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// 若 循环 队列 sq 未 满 ,插入 x 为 新 的 队 尾 元 素 ,否则 队列 状态 不 变 并 给 出 错误 信息 
if ((sq—> rear+1)%maxsize== sq 一 > front) 
printf("Overflow"); 
else 


{ 
sq—>rear= (sq 一 > rear+1)%maxsize; 
sq 一 > elem[ sq 一 > rear] =x; 


} 


6. 出 队 操作 
算法 3.18 循环 队列 出 队 算法 。 


elemtype DelQueue( cqueuetp * sq) 
{ 
// 若 循环 队列 sq 不 空 , 则 删 去 队 头 元 素 并 返回 元 素 值 ,否则 返回 空 元 素 NULL 
if(sq-> front == sq 一 > rear) 
return NULL; 
else 
sq 一 > front = (sq 一 > front+ 1) %maxsize; 
return(sq 一 > elem[ sq 一 > front]); 


3.3.3 队列 的 链 式 存储 结构 


与 栈 的 顺序 存储 一 样 , 队 列 的 顺序 存储 也 存在 溢出 的 情况 ,因此 可 以 考虑 采用 队列 的 链 
式 存储 结构 。 

队列 的 链 式 存储 结构 简称 链 队列 , 它 实 际 上 是 一 个 同时 带 有 头 指针 和 尾 指针 的 单 链表 ， 
头 指针 指向 队 头 结 点 , 尾 指针 指向 队 尾 结 点 :如 图 3. 13 所 示 。 虽 然 用 头 指针 就 可 以 唯一 确 
定 这 个 单 链表 ,但 是 插入 操作 总 是 在 队 尾 进行 ,如 果 没 有 尾 指针 ,人 队 操作 的 时 间 复 杂 度 将 
由 O(C1) 升 到 O(Cz) 。 


e ~ ee ~ ee ~ i ~ ee 


1q.front 


图 3.13 链 队列 示意 图 


链 队 列 的 类 型 定义 如 下 : 


typedef struct NODETYPE 
{ 
elemtype data; 
struct NODETYPE * next; 
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}nodetype; 

typedef struct 

{ 
nodetype * front; 
nodetype * rear; 


}lqueuetp; 


其 中 , 头 ` 尾 指针 被 封装 在 一 起 ,将 链 队 列 的 类 型 lqueuetp 定义 为 一 个 结构 类 型 , 若 做 如 下 
操作 : 


lqueuetp 1q; 


则 得 到 一 个 链 队 列 变量 ,其 好 处 是 使 得 对 lq 的 操作 , 仅 涉及 结构 变量 1q。 
由 图 3. 13 容易 看 出 , 链 队 列 空 的 判断 条 件 为 : 


1q. front = 1q. rear 
下 面 给 出 在 链 队列 上 实现 的 操作 。 
1. 初始 化 操作 

算法 3.19 链 队列 初始 化 算法 。 


void InitQueue( lqueuetp * 19q) 
// 设 置 一 个 空 的 链 队 列 lq 
lq->front= (nodetype * )malloc(sizeof(nodetype)); 
1q 一 > front 一 > next = NULL; 
lq-> rear= 1q 一 > front; 


如 下 函数 实现 了 对 一 个 链 队 列 的 定义 以 及 初始 化 操作 。 


void main() 

{ 
lqueuetp * lq; 
lq= (lqueuetp * )malloc(sizeof(lqueuetp)); 
Initoueue(1q) ; 


2. 判 队 空 操作 
算法 3.20 链 队列 判 队 空 算法 。 


int QueueEmpty( lqueuetp * 1q) 
{ 
if (lq—-> front == 1q—> rear) 
return 1; 


return 0; 
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3. 求 队长 度 操 作 
算法 3.21 求 链 队列 长 度 算法 。 


int Size( lqueuetp * 19q) 
{ 
// 返 回 队列 中 元 素 个 数 
int i=0; 
nodetype * p=1q->front—> next; 
while(p) 
{ 
2 
p=p->next; 
} 


return i; 


4. 读 队 头 元 素 操 作 
算法 3.22 读 链 队 列队 头 元 素 算法 。 


elemtype Head( lqueuetp * 1q) 
{ 
// 若 链 队列 1q 不 空 , 则 返回 队 头 元 素 值 ,否则 返回 空 元 素 NULL 
if(1q-> front == 1q 一 > rear) 
return NULL; 
else 
return (lq—> front -> next 一 > data); 


5. 入 队 操 作 
算法 3.23 链 队 列 人 队 算 法 。 


void EnQueue( lqueuetp * lq,elemtype x) 

{ 
// 在 链 队 列 1q 中 ,插入 x 为 新 的 队 尾 元 素 
nodetype *s; 
s= (nodetype * )malloc(sizeof(nodetype)); 
s->data=x; 
s-> next= NULL; 
1q 一 > rear 一 > next= S; 


lq—->rear=s; 


6. 出 队 操 作 
算法 3.24 链 队 列 出 队 算法 。 


elemtype DelQueue( lqueuetp * 1q) 
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// 若 链 队列 1q 不 空 , 则 删 去 队 头 元 素 并 返回 元 素 值 ,否则 返回 空 元 素 NOLL 
elemtype x; 
nodetype *p; 
if(1q-> front == 1q 一 > rear) 
return NULL; 
else 
{ 
p=1q-> front 一 > next; 
lq—>front—>next=p->next; 
if(p—> next == NULL) 
1q->rear=1q->front; // 当 链 队 列 中 仅 有 一 个 结 点 时 ,出 队 时 还 需 修改 尾 指针 
x=p-> data; 
free(p); 


return x; 


} 

注意 : 

(1) 链 队 列 和 链 栈 类 似 ,无 须 判 队 满 操作 。 

(2) 在 出 队 算法 中 , 当 原 队 中 只 有 一 个 结 点 时 ,该 结 点 既是 队 头 也 是 队 尾 , 故 删 去 此 结 
点 时 也 需 修 改 尾 指针 , 且 删 去 此 结 点 后 队列 变 空 。 

(3) 和 和 链 栈 情况 相同 ,对 于 链 队列 ,一 般 不 会 产生 队列 满 。 由 于 队列 的 长 度 变化 一 般 比 
较 大 ,所 以 用 链 式 存储 结构 比 用 顺序 存储 结构 更 有 利 。 


@.4 队列 的 应 用 实例 


在 日 常生 活 中 有 很 多 队列 的 应 用 ,如 银行 窗口 排队 等 待 服务 、 车 辆 在 单行 道上 行驶 等 。 
本 节 介 绍 两 个 队列 应 用 的 实例 : 舞伴 问题 和 打印 队列 的 模拟 管理 。 前 者 是 用 两 个 队列 来 完 
成 匹配 ; 后 者 是 一 个 典型 的 离散 事件 的 模拟 。 


3.4.1 舞伴 问题 
1. 问题 叙述 


在 周末 舞会 上 ,男士 们 和 女士 们 进入 舞厅 时 ,各 自 排 成 一 队 ,跳舞 开始 时 ,依次 从 男 队 和 
女 队 的 队 头 上 各 出 一 人 配 成 舞伴 , 若 两 队 初始 人 数 不 相同 , 则 较 长 的 一 队 中 未 配对 者 需 等 待 
下 一 支 舞 曲 。 现 要 求 写 一 算法 模拟 上 述 舞伴 配对 问题 。 


2. 问题 分 析 


从 问题 叙述 看 , 先 人 队 的 男士 和 女士 分 别 先 出 队 配 成 舞伴 ,因此 该 问题 具有 典型 的 先进 
先 出 特性 ,可 用 队列 作为 算法 的 数据 结构 。 

在 算法 中 ,假设 男士 和 女士 的 记录 存放 在 一 个 数组 中 作为 输入 ,然后 依次 扫描 该 数组 的 
各 元 素 , 并 根据 性 别 来 决定 是 进入 男 队 还 是 女 队 。 当 这 两 个 队列 构造 完成 后 ,依次 将 两 队 当 
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前 的 队 头 元 素 出 队 来 配 成 舞伴 ,直至 某 队列 变 空 为 止 。 此 时 , 若 某 队 仍 有 等 待 配对 者 ,输出 
此 队列 中 等 待 者 的 人 数 及 排 在 队 头 的 等 待 者 的 名 字 , 他 (或 她 ) 将 是 下 一 支 舞 曲 开始 时 第 一 
个 可 获得 舞伴 的 人 。 


3. 相关 类 型 定义 及 具体 算法 
算法 3.25 舞伴 配对 算法 。 


typedef struct 


char name[ 20]; 


char sex; // 性 别 , 'F' 表 示 女 性 , 'M' 表 示 男 性 
Person; 
typedef Person DataType; // 将 队列 中 元 素 的 数据 类 型 改 为 Person 


typedef struct 


DataType elem[ maxsize]; 
int front, rear; 
squeuetp; 
void DancePartner(Person dancer[ ], int num) 


// 结 构 数组 dancer 中 存放 跳舞 的 男女 ,num 是 跳舞 的 总 人 数 


int i; 
Person p; 
squeuetp Mdancers, Fdancers; 
InitQueue( gSMdancers); // 男 士 队列 初始 化 
InitQueue( &Fdancers); // 女 士 队列 初始 化 
for(i=0;i<num;it+) // 依 次 将 跳舞 者 依 其 性 别人 队 
{ 
p= dancer[i]; 
if(p. sex == 'F') 
EnQueue( gFdancers, p); // 排 入 女 队 
else 
EnQueue( SMdancers, p); // 排 入 男 队 
} 


printf("The dancing partners are: \n \n"); 
while( !QueueEmpty( &Fdancers)&&! QueueEmpty( gMdancers)) 
{ 


p= DelQueue(&Fdancers) ; // 女 士 出 队 
printf("%s ",p.name); 
p= DelQueuel( gMdancers); // 男 士 出 队 


printf(" % s\n",p.name); 
上 
if(!QueueEmpty(&Fdancers)) 


{ // 输 出 女士 剩余 人 数 及 队 头 女士 的 名 字 
printf("\n There are $d women waitin for the next round. \n", Size(&Fdancers)); 
p= Head(&Fdancers); // 取 队 头 


printf("%s will be the first to get a partner. \n",p.name); 
} 
else if(!QueueEmpty( gMdancers)) 
{ // 输 出 男 队 剩余 人 数 及 队 头 男士 的 名 字 
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printf("\n There are % d men waiting for the next round. \n", Size( &Mdancers) ) ; 
p= Head( gMdancers); 
printf(" %s will be the first to get a partner. \n", p. name); 


， 


3.4.2 打印 队列 的 模拟 管理 
1. 问题 描述 


计算 机 中 有 一 个 缓冲 区 用 来 保存 打印 队列 ,所 有 的 打印 任务 按 先后 顺序 进入 此 队列 , 当 
打印 机 空闲 时 ,就 从 队列 中 调 出 一 个 任务 执行 打印 工作 。 现 在 要 求 编写 一 个 程序 ,模拟 在 一 
个 时 段 内 (时 间 单 位 为 分 钟 ) 的 打印 过 程 , 要 求 输出 每 个 打印 任务 的 开始 时 间 和 打印 时 间 。 


2. 问题 分 析 


该 问题 需要 模拟 出 每 个 打印 任务 的 开始 时 间 和 打印 时 间 , 这 是 一 个 典型 的 离散 事件 模 
拟 。 可 以 把 一 个 任务 的 开始 打印 和 打印 完成 这 两 个 时 刻 称 为 事件 ,整个 模拟 程序 会 按 事件 
发 生 的 先后 顺序 进行 处 理 。 

在 这 个 问题 中 ,不妨 将 事件 逐个 存放 在 一 个 队列 里 ,用 循环 依次 触发 这 些 事件 。 在 每 一 
个 开始 打印 事件 发 生 时 ,显示 其 任务 编号 和 开始 时 间 ; 在 每 一 个 打印 结束 事件 发 生 时 ,显示 
该 任务 的 打印 时 间 ,流程 图 如 图 3. 14 所 示 。 


站 


执行 开始 打印 事件 执行 打印 结束 事件 


结束 
图 3.14 模拟 打印 队列 的 流程 图 


现在 的 问题 是 ,如 何 添加 这 些 事件 呢 ? 

解决 方法 是 : 可 以 在 一 个 任务 的 开始 事件 中 添加 这 个 任务 的 结束 事件 ,在 一 个 任务 的 
结束 事件 中 添加 下 一 个 任务 的 开始 事件 (当然 要 先 判 断 是 否 已 超过 了 打印 机 的 工作 时 间 )。 

下 面 是 算法 中 要 使 用 的 一 些 数据 结构 和 操作 的 说 明 。 


typedef struct EVENT // 事 件 
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{ 
int number; // 任 务 编号 
int starttime; // 事 件 开始 时 间 
int durtime; // 任 务 执行 时 间 
int type; //type 为 0 表示 开始 打印 事件 ,否则 打印 结束 事件 
struct EVENT 关 next; 
}event; 


typedef struct 
{ 
event * front; 
event * rear; 
}event list; // 事 件 队列 
void task over(event list ev, event e int lasttime, int tasknumber); 


void task start(event list ev,event e); 


void init event list(event list * ev); // 初 始 化 队列 

void ins_event list(event _ list x ev,event xee);  // 在 队列 中 插入 一 个 事件 
event del event list(event list * ev); // 第 一 个 结 点 出 队列 

int isempty(event list x ev); // 判 断 事件 队列 是 否 为 空 

int random( ); // 得 到 一 个 随机 数 


算法 3. 26 是 在 上 述 工作 的 基础 上 实现 。 
算法 3.26 模拟 打印 队列 。 


void main() 


{ 


int lasttime = 100; // 任 务 到 达 的 最 迟 时 刻 
event_ list ev; 
int tasknumber = 0; // 任 务 编号 


// 添 加 一 个 任务 开始 事件 
event ee, en; 
ee. type = 0; 
ee. starttime = 0; 
ee. durtime = random( ); 
ee. number = tasknumber++ 
ins_event list(&ev, &ee); 
while(!isempty(&ev)) 
{ 
en=del event list(&ev); 
if(en. type == 0) 
task_start(ev, en); 
else 
task_over(ev, en, lasttime, tasknumber); 
} 
} 
// 任 务 开始 事件 执行 的 程序 
void task_ start(event list ev,event e) 
printf("\ng d: tast% d now begin!", e. starttime, e. number);  // 打 印 任务 开始 时 间 
// 添 加 任务 结束 事件 
event ee; 
ee.type= 1; 
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ee. starttime = e. starttime + e. durtime; 
ee. number = e. number; 
ins_event list(&ev, &ee); 


} 


// 任 务 开始 事件 执行 的 程序 
void task over(event list ev, event e, int lasttime, int tasknumber) 
{ 
printf("\n%d: tast % d now over!",e. starttime, e. number); // 打 印 任务 结束 时 间 
int temp = random( ); // 下 一 个 任务 间隔 多 少时 间 


if(e. starttime + temp<= lasttime) 
{ // 添 加 下 一 任务 开始 事件 
event ee; 
ee. type= 0; 
ee. starttime = e. starttime + temp; 
ee. durtime = random( ); // 下 一 个 任务 的 执行 时 间 
ee. number = tasknumber++; 
ins_event list(&ev, &ee); 
} 

} 

该 算法 能 够 模拟 一 个 打印 机 的 执行 情况 。 当 然 ,在 实际 应 用 中 还 可 能 有 多 种 情况 ,如 每 
个 打印 任务 的 最 短 时 间 、 最 长 时 间 以 及 两 个 任务 的 最 长 和 最 短 时 间 间 隔 可 以 由 用 户 设 定 。 
另外 ,车 有 多 个 打印 机 从 一 个 打印 队列 提取 任务 该 怎么 处 理 ? 若 有 多 个 打印 机 从 多 个 队列 
提取 任务 又 该 怎么 做 ? 这些 问 题 留 给 读者 思考 。 


6.5 递归 


递归 是 一 个 数学 概念 ,也 是 一 种 有 用 的 程序 设计 方法 。 在 程序 设计 中 ,处 理 重 复 性 计算 
最 常用 的 方法 是 组 织 迭 代 循 环 ,此 外 还 可 以 采用 递归 计算 的 方法 ,特别 是 非 数值 计算 领域 中 
更 是 如 此 。 

递归 本 质 上 也 是 一 种 循环 的 程序 结构 , 它 把 较 复杂 的 计算 逐次 归结 为 较 简单 的 情形 的 
计算 ,一 直 归 结 到 最 简单 的 情形 的 计算 ,并 得 到 计算 结果 为 止 。 许 多 问题 都 采用 递归 方法 来 
编写 程序 ,使 得 程序 非常 简洁 和 清晰 ,易于 分 析 。 


3.5.1 递归 的 定义 及 递归 模型 

1. 递归 的 定义 

程序 调用 自身 的 编程 方法 称 为 递归 。 若 一 个 对 象 部 分 地 包含 它 自己 ,或 用 它 自己 给 自 
己 定义 , 则 称 这 个 对 象 是 递归 的 ; 若 一 个 过 程 直接 地 或 间接 地 调用 自己 , 则 称 这 个 过 程 是 弟 
归 的 过 程 。 

直接 递归 : 

fun a() 


人 


fun al() 
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} 
间接 递归 
fun a() 


fun b() 


许多 计算 机 问题 采用 递归 的 方法 来 解决 非常 方便 。 但 是 ,一 个 问题 要 采用 递归 方法 来 
解决 时 ,必须 符合 以 下 3 个 条 件 。 

(1) 解决 问题 时 ,可 以 把 一 个 问题 转化 为 一 个 新 的 问题 ,而 这 个 新 的 问题 的 解决 方法 仍 
与 原 问 题 的 解法 相同 ,只 是 所 处 理 的 对 象 有 所 不 同 ,这 些 被 处 理 的 对 象 之 间 是 有 规律 地 递增 
或 递减 的 。 

(2) 可 以 通过 转化 过 程 使 问题 得 到 简化 。 

(3) 必定 要 有 一 个 明确 的 结束 递归 的 条 件 ,否则 递归 将 会 无 休止 地 进行 下 去 ,直到 耗 尽 
系统 资源 。 也 就 是 说 必须 要 有 某 个 终止 递归 的 条 件 。 

例如 求 阶乘 的 问题 。 如 果 要 求 n 的 阶乘 (x1), 可 以 把 这 个 问题 转化 为 n * (2 一 1)1; 而 
要 求 (n 一 1)! 又 可 转化 为 (2 一 1) * (2 一 2)1 ……… 这 里 面 都 有 一 个 数 乘 以 另 一 个 数 的 阶乘 
的 问题 ,被 处 理 的 对 象 分 别 是 zz 一 1,…, 这 些 数 是 有 规律 地 递减 。 为 了 避免 程序 无 休止 地 进 
行 下 去 ,必须 要 给 一 个 结束 条 件 。 该 问题 恰好 有 一 个 结束 条 件 , 即 当 * 一 0 时 ,0! 一 1。 

下 述 3 种 情况 常常 会 用 到 递归 的 方法 。 

(1) 定义 是 递归 的 。 

阶乘 函数 的 定义 就 是 采用 的 递归 方法 ,其 定义 为 
7 一 0 // 递 归 终止 条 件 


! 一 
nx*(n 一 1) 7 二 0 // 递 归 步 又 
求解 阶乘 函数 的 递归 算法 如 算法 3. 27。 


算法 3.27 求解 阶乘 函数 的 递归 算法 。 


long fact(long n) 
{ 
if (n== 0) return 1; 
else returnn * fact(n—1); 


} 
(2) 问题 的 解法 是 递归 的 。 


汉 诺 塔 问题 : 古代 有 一 个 焚 塔 , 塔 内 有 A、B、`C 3 个 柱 ,A 柱 上 有 64 个 盘子 ,盘子 大 小 不 
等 ,大 的 在 下 ,小 的 在 上 ,如 图 3. 15 所 示 。 有 一 个 和 尚 想 把 这 64 个 盘子 从 A 柱 移 到 C 柱 ， 
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但 每 次 只 允许 移动 一 个 盘子 ,并 且 在 移动 过 程 中 ,3 个 柱 上 的 盘子 始终 保持 大 盘 在 下 ,小 盘 
在 上 。 在 移动 过 程 中 可 以 利用 BB 柱 ,要 求 给 出 移动 的 步 又 。 


| 


A B C 


图 3.15 汉 诺 塔 问题 


汉 诺 塔 问题 的 解法 就 是 按 递归 算法 实现 的 。 

如 果 n= 二 1, 则 将 这 一 个 盘子 直接 从 A 柱 移 到 C 柱 上 ,否则 ,执行 以 下 3 步 : 
Q@ 用 C 柱 作 过 渡 , 将 A 柱 上 的 (一 1) 个 盘子 移 到 B 柱 上 ， 

@ 将 A 柱 上 最 后 一 个 盘子 直接 移 到 C 柱 上 ; 

@ 用 A 柱 作 过 渡 , 将 B 柱 上 的 (x 一 了 个 盘子 移 到 C 柱 上 。 

算法 3.28 汉 诺 塔 问题 算法 


void hanoi(int n, char A, char B, char C) 
{ 
if(n==1) 
move(1,A,c); 
else{ 
hanoi(n— 1,A,c,B); 
move(n, A,C); 
hanoi(n— 1,B,A,cC); 
; 
} 


(3) 数据 结构 是 递归 定义 的 。 
在 第 5 章 介绍 二 又 树 时 ,将 看 到 二 叉 树 是 一 种 递归 定义 的 数据 结构 ,其 遍历 等 操作 常常 


采用 递归 的 方法 实现 。 
单 链 表 也 可 以 看 成 是 一 个 递归 的 数据 结构 ,其 定义 为 : 一 个 结 点 , 它 的 指针 域 为 
NULL ,是 一 个 单 链表 ; 一 个 结 点 , 它 的 指针 域 指向 单 链表 , 仍 是 一 个 单 链表 。 
算法 3.29 搜索 单 链表 最 后 一 个 结 点 并 打印 其 数值 算法 
void Print (Lnode x*f£) //f 是 单 链表 的 头 指针 
{ 
if (f!= NULL){ 


if (上 一 > next == NULL) 
printf("%d\n", £f —> data); 
else Print(f -> next); 
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2. 递归 模型 


递归 设计 首先 要 确定 求解 问题 的 递归 模型 ,了 解 递归 的 执行 过 程 ,在 此 基础 上 进行 递归 
程序 设计 ,同时 还 要 掌握 从 递归 到 非 递归 的 转换 过 程 。 
递归 模型 反映 一 个 递归 问题 的 递归 结构 ,例如 : 
(1) f(0)=1; 
(2) f(n)=nx* f(n—1),n>0。 
(1) 给 出 了 递归 的 终止 条 件 ,(2) 给 出 了 了 (mn) 的 值 与 f(n 一 1) 的 值 的 关系 ,在 这 个 问题 
中 ,把 (1) 称 为 递归 出 口 ,(2) 称 为 递归 体 。 
一 般 地 ,一 个 递归 模型 是 由 递归 出 口 和 递归 体 两 部 分 组 成 ,前 者 确定 递归 到 何 时 为 止 ， 
后 者 确定 递归 的 方式 。 
(1) 递归 出 口 的 一 般 格式 为 : 
f(s0)=mo 
这 里 的 so 与 me 均 为 常量 。 有 的 递归 问题 可 能 有 几 个 递归 出 口 。 
(2) 递归 体 的 一 般 格 式 为 : 
FOy=(F GD Gm 
其 中 ,s 是 一 个 递归 的 “大 问题 ”; s,s,,…,s, 是 递归 的 “小 问题 >; cl ,cs,…,c, 是 若干 个 可 
以 直接 (用 非 递归 方法 ) 解 决 的 问题 ; g 是 一 个 非 递 归 函 数 , 反 映 了 递归 问题 的 结构 。 
例如 ,无 穷 数 列 1,1,2,3,5,8,13,21,34,55,…, 称 为 Fibonacci 数列 , 它 可 以 递归 地 定 
义 为 : 
1 7 一 0 
em 于 一 1 
Fl(n—1)+F(n—2) n>1 
其 中 ,n==0 和 二 1 时 是 递归 出 口 ,” 二 1 时 是 递归 体 。 


3.5.2 递归 的 实现 


递归 过 程 在 实现 时 ,需要 自己 调用 自己 , 层 层 向 下 递归 ,退出 时 的 次 序 则 正好 相反 ,例如 
阶乘 函数 的 递归 过 程 如 图 3. 16 所 示 。 


递归 调用 次 序 


nn WD) ED > … CC 一 >》 1! > ol 


一 


递归 返回 次 序 
图 3.16 阶乘 函数 的 递归 过 程 
为 保证 递归 过 程 的 每 次 调用 和 返回 得 以 正确 执行 ,必须 解决 调用 时 的 参数 传递 和 返回 
地 址 问题 。 因 此 ,在 每 次 递归 过 程 调用 时 ,必须 做 地 址 保存 .参数 传递 等 工作 。 一 般 地 ,每 一 
层 递归 调用 所 需要 保存 的 信息 构成 一 个 工作 记录 ,一 个 工作 记录 通常 包括 如 下 内 容 : 
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(1) 返回 地 址 , 即 本 次 递归 过 程 调用 语句 的 后 继 语句 的 地 址 ; 

(2) 本 次 调用 中 与 形 参 结合 的 实 参 值 ,包括 函数 名 、 引 用 参数 与 数值 参数 等 ; 

(3) 本 次 递归 调用 中 的 局 部 变量 值 。 

每 执行 一 次 递归 调用 ,系统 就 需要 建立 一 个 新 的 工作 记录 ,并 将 其 压 入 递归 工作 栈 ; 每 
退出 一 层 递归 ,就 从 递归 工作 栈 中 弹出 一 个 工作 记录 。 由 此 可 见 , 栈 顶 的 工作 记录 必定 是 当 
前 正在 执行 的 这 一 层 递 归 调 用 的 工作 记录 ,所 以 又 称 为 当前 活动 工作 记录 。 

例 3.2 说 明 下 列 阶乘 函数 Factorial() 的 活动 记录 组 成 部 分 以 及 每 一 次 调用 时 的 活动 
记录 的 值 。 


long Factorial(long n) { 
int temp; 
if (n == 0) return 1; 
else temp = n * Factorial(n— 1); 
RetLoc2 
return temp; 
} 
void main() { 
int n; 
n= Factorial (4); 


RetLocl 4 
} 


说 明 : 阶乘 函数 Factorial() 的 工作 记录 由 实 参 值 n、 返 回 位 置 和 局 部 变量 temp 3 个 域 
组 成 ,为 了 简化 问题 ,只 考察 由 实 参 值 n 和 返回 位 置 这 两 个 域 组 成 的 工作 记录 。 
阶乘 函数 Factorial() 每 一 次 递归 调用 时 的 活动 记录 如 图 3. 17 所 示 。 


上 
参数 n ”返回 地 址 返回 地 址 ”返回 时 指令 

4 RetLocl RetLocl return 4*6 
国 

= 3 RetLoc2 RetLoc2 | return 3*2 
调 返 
用 回 
顺 2 RetLoc2 RetLoc2 | return 2*1 顺 
序 序 

1 RetLoc2 RetLoc2 return 1*1 

1 0 RetLoc2 RetLoc2 return 1 


图 3.17 阶乘 函数 Factorial() 每 一 次 递归 调用 时 的 活动 记录 


3.5.3 递归 设计 


进行 递归 设计 时 ,首先 要 给 出 递归 模型 ,然后 再 转换 成 对 应 的 C 语言 函数 。 

从 递归 的 执行 过 程 看 ,要 解决 f(s) ,不 是 直接 求 其 解 .而 是 转化 为 计算 f(s') 和 一 个 常 
量 c 。 求解 f(s') 的 方法 与 环境 和 求解 f(s) 的 方法 与 环境 是 相似 的 ,但 f(s) 是 一 个 “大 问 
题 ”, 而 f(s ) 是 一 个 “ 较 小 问题 ”, 尽 管 f(s ) 还 未 解决 ,但 向 解决 目标 靠近 了 一 步 ,这 就 是 一 
个 “量变 ”, 如 此 到 达 递 归 出 口 , 便 发 生 了 质变 ,递归 问题 就 解决 了 。 因 此 ,递归 设计 就 是 要 给 
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出 合理 的 “ 较 小 问题 ”, 然 后 确定 “大 问题 "的 解 与 “ 较 小 问题 "之 间 的 关系 , 即 确定 递归 体 ; 最 
后 朝 此 方向 分 解 , 必 然 有 一 个 简单 基本 问题 解 ,以 此 作为 递归 出 口 。 由 此 得 出 递归 设计 的 步 
又 如 下 : 

(1) 对 原 问 题 f(s) 进行 分 析 , 假 设 出 合理 的 较 小 问题 f(s'); 

(2) 假设 f(s') 是 可 解 的 ,在 此 基础 上 确定 f(s) 的 解 , 即 给 出 f(s) 与 f(s') 的 关系 ; 

(3) 确定 一 个 特定 情况 (f(1) 或 (0)) 的 解 ,由 此 作为 递归 出 口 。 

递归 函数 编写 注意 事项 如 下 : 

(1) 利用 递归 边界 书写 出 口 /入 口 条 件 ; 

(2) 递归 调用 时 参数 要 朝 出 口 方 向 修改 ,每 次 递归 发 生 改变 的 量 要 作为 参数 出 现 ; 

(3) 当 递 归 函 数 有 返回 值 时 ,在 函数 体内 对 每 个 分 支 的 返回 值 赋值 ; 

(4) 谨慎 使 用 循环 语句 ; 

(5) 注意 理解 当前 的 工作 环境 ( 即 工作 栈 的 内 容 ) 。 

递归 函数 编写 注意 事项 的 说 明 见 例 3. 3 。 

例 3.3 用 递归 函数 实现 归并 排序 算法 。 

void MergeSort(TYpe a[ ], int left, int right) // 对 数组 a 进行 归并 排序 

// 排 序 区 间 [left,right] 会 发 生 改 变 , 为 此 left 和 right 作为 参数 出 现 


{ 
if (left < right) // 出 口 /入 口 条 件 


{ 
int i= (left + right)/2; 


mergeSort (a, left, i); // 参 数 朝 出 口 方向 修改 
mergeSort(a, i+1, right); // 参 数 朝 出 口 方向 修改 
merge(a, b, left, i, right); // 两 个 有 序 表 归 并 为 一 个 有 序 表 , 达到 整体 有 序 


copy(a, b, left, right); 


} 


3.5.4 递归 到 非 递归 的 转换 


递归 方法 虽然 在 解决 某 些 问题 时 是 最 直观 .最 方便 的 方法 ,但 却 并 不 是 一 种 高 效 的 方 
法 ,主要 原因 在 于 递归 方法 过 于 频繁 地 进行 函数 调用 和 参数 传递 。 在 这 种 情况 下 , 若 采 用 循 
环 或 递归 算法 的 非 递 归 实 现 , 将 会 大 大 提高 算法 的 执行 效率 。 

求解 递归 问题 有 两 种 方法 : 一 种 是 直接 求 值 .不 需要 回溯 的 ; 另 一 种 是 不 能 直接 求 值 ， 
需要 回溯 的 。 这 两 种 方式 在 转换 成 非 递归 问题 时 采用 的 方式 也 不 相同 : 前 者 使 用 一 些 中 间 
变量 保存 中 间 结 果 , 称 为 直接 转换 法 ; 后 者 需要 回溯 ,所 以 要 用 栈 来 保存 中 间 结果 , 称 为 间 
接 转换 法 。 


1. 直接 转换 法 
该 方法 使 用 一 些 中 间 变 量 保存 中 间 结 果 。 
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例 3.4 编写 一 个 函数 ,用 非 递 归 方 法 计算 如 下 递归 函数 的 值 : 


DD=1 
2)=1 
fn)=fn—1)+f(n—2) n>2 
解 : 
int f(int n) 
{ 
int i,s, sl, s2; 
sl=1; //sl 用 于 保存 ftn- 1) 的 值 
s2=1; //s2 用 于 保存 f(n- 2) 的 值 
s=1; 
for (i=3;i<=n;it+) 
{ 
s=sl+s2; 
s2= sl; 
sl=8s; 
} 
return(s); 
} 
2. 间接 转换 法 


该 方法 使 用 栈 保存 中 间 结 果 。 其 一 般 过 程 如 下 。 


将 初始 状态 s 进 栈 ; 
while ( 栈 不 为 空 ) 
{ 
退 栈 ,将 栈 项 元 素 赋 给 s; 
证 (s 是 要 找 的 结果 ) 返回 ; 
else 
{ 
寻找 到 s 的 相关 状态 sl1; 
将 sl 进 栈 ; 
} 


间接 转换 法 的 示例 见 算法 5. 4。 
6.6 C++ 中 的 栈 和 队列 
A 


3.6.1 C++ 中 的 栈 


借助 C++ 的 模板 抽象 类 来 定义 栈 抽 象 数据 类 型 stack, 它 作为 顺序 栈 类 seqstack 的 基 
类 。 例 3. 5 给 出 了 栈 类 stack 的 规范 定义 ,保存 在 头 文件 stack.h 中 。 
例 3.5 栈 类 。 


井 include < iostream.h> 
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template < class T> 

class stack 

{ 

public: 

virtual bool isempty() const = 0; 
Virtual bool isfull() const= 0; 
virtual bool top(T& x) const = 0; 
Virtual bool push(T x) = 0; 
virtual bool pop(T& x) = 0; 
Virtual void clear()=0; 


}; 


栈 的 顺序 表示 方式 也 用 C++ 中 的 一 维 数组 加 以 描述 。 在 顺序 栈 类 seqstack 中 ,私有 成 
员 包 括 最 大 栈 顶 指针 (下 标 )maxtop、 当 前 栈 顶 指针 top 和 指向 数组 的 指针 elem。 

例 3.6 给 出 顺序 栈 类 的 定义 和 实现 , 它 是 stack 类 的 派生 类 ,其 定义 保存 在 头 文件 
seqstack.h 中 。 


// 顺 序 栈 类 

# include < stack.h> 

template < class 了 > 

class seqstack:public stack <T> 

public: 

seqstack( int msize); 
一 seqstack(){delete[ ] elem;} 
bool isempty() const {return top == —1;} 
bool isfull() const{return top == maxtop;} 
bool top(T& x) const; 
bool push(T x) = 0; 
bool pop(T& x) = 0; 
void clear(){ top= —1;} 


private: 
int top; // 栈 项 指针 
int maxtop; // 最 大 栈 顶 指针 
T *elem; 


}; 
template <class T> 
seqstack <T>: :seqstack(int msize) 
maxtop = msize— 1; 
elem = new T[msize]; 
tp 一 一 3 
} 
template < class 了 > 
bool seqstack <T>::isempty() const 
{ 
return n== 0; 
} 
template <class T> 
bool seqstack <T>: :top(T &x) const 
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证 (isempty()){ 
cout <<"empty"<< endl; 
return false; 
} 
x= elem[ top]; 
return true; 
} 
template <class T> 
bool seqstack <T>::push(T x) const 
{ 
if (isfull()){ 
cout <<"overflow"<< end]; 
return false; 
} 
s[topt+] = xi 
return true; 
} 
template <class T> 
bool seqstack <T>::pop(T& x) const 
{ 
if (isempty()){ 
cout <<"underflow"<< endl; 
return false; 
} 
x= elem[ -- top]; 
return true; 


3.6.2 C++ 中 的 队列 


借助 C++ 的 模板 抽象 类 来 定义 队列 抽象 数据 类 型 queue, 它 作为 循环 队列 类 seqqueue 
的 基 类 。 
例 3.7 给 出 队列 类 queue 的 规范 定义 ,保存 在 头 文件 queue.h 中 。 


// 队 列 类 

# include < iostream.h> 

template < class 了 > 

class queue 

上 

public: 

virtual bool isempty() const = 0; 
virtual bool isfull() const = 0; 
virtual bool front(T& x) const = 0; 
virtual bool enqueue(T x) = 0; 
virtual bool dequeue(T& x) = 0; 
virtual void clear()=0; 


}; 
队列 的 顺序 表示 方式 也 可 以 用 C++ 中 的 一 维 数组 加 以 描述 。 循 环 队 列 类 seqqueue 中 ， 


第 3 章 栈 和 队列 “105 
yd 


私有 成 员 包括 最 大 队列 容量 maxsize、 队 头 指 针 front、 队 尾 指 针 rear 和 指向 数组 的 指针 


elem。 
例 3.8 给 出 循环 队列 类 的 定义 和 实现 , 它 是 queue 类 的 派生 类 ,保存 在 头 文件 
sedqueue.h 中 。 


// 循 环 队列 类 

井 include < queue.h> 

template < class T> 

class seqqueue:public queue <T> 

{ 

public: 

seqqueue( int msize); 
一 seqqueue( ){delete[ ] elem;} 
bool isempty() const {return front == rear;} 
bool isfull() const{return (rear +1) % maxsize == front;} 
bool front(T& x) const; 
bool enqueue(T x); 
bool dequeue(T& x); 
void clear(){front = rear = 0;} 


private: 
int front, rear; // 栈 顶 指针 
int maxsize; // 最 大 栈 顶 指针 
T * elem; 


}; 
template <class T> 
seqqueue <T>::seqqueue( int msize) 
{ 
maxslze = mS1LZe7 
elem = new T[msize]; 
front = rear = 0; 
} 
template <class T> 
bool seqqueue <T>: :front(T &x) const 
{ 
if (isempty()){ 
cout <<"empty"<< endl; 
return false; 
} 
x= elem[ (front +1) % maxsize]; 
return true; 
l 
template <class T> 
bool seqqueue <T>::enqueue(T x) const 
if (isfull()){ 
cout <<"overflow"<< endl; 
return false; 
} 
elem[rear = (rear + 1) % maxsize] = xj 


return true; 
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} 
template < class T> 
bool seqqueue <T>: :dequeue(T& x) const 
{ 
if (isempty()){ 
cout <<"underflow"<< endl; 
return false; 
} 
x= elem[front = (front +1) % maxsize]; 
return true; 


回 题 3 


1. 设 将 整数 a,b,c,d 依次 进 栈 , 但 只 要 出 栈 时 栈 非 空 , 则 可 将 出 栈 操作 按 任何 次 序 加 
入 其 中 ,请 回答 下 述 问题 : 

(1) 车 执行 以 下 操作 序列 Push(a) ,Pop(),Push(b),Push(Cc) ,Pop(),Pop(),Push(Cd) ， 
Pop(), 则 出 栈 的 数字 序列 为 何 ( 这 里 Push(i) 表 示 i 进 栈 ,Pop() 表 示 出 栈 )? 

(2) 能 否 得 到 出 栈 序列 adbc 和 adcb 并 说 明 为 什么 不 能 得 到 或 者 如 何 得 到 ? 

(3) 请 分 析 a,b,c,d 的 所 有 排列 中 ,哪些 序列 是 可 以 通过 相应 的 人、 出 栈 操 作 得 到 的 。 

2. 分 别 借助 顺序 栈 和 链 栈 ,将 单 链表 倒置 。 

3. 有 两 个 栈 A,B 分 别 存储 一 个 升序 数列 , 现 要 求 编写 算法 把 这 两 个 栈 中 的 数 合 成 一 
个 升序 队列 。 

4. 设 两 个 栈 共享 一 个 数组 空间 ,其 类 型 定义 见 3. 1. 2 节 , 试 写 出 两 个 栈 公 用 的 读 栈 顶 
元 算法 elemtp top_dustack (dustacktp ds,p; int i)、 进 栈 操 作 算法 void push_dustack 
(dustacktp ds,p; int i,elemtp x) 及 出 栈 算法 elemtp pop_dustack(dustacktp ds,p; int i) 。 
其 中 i 的 取 值 是 1 或 2, 用 以 指示 栈 号 。 

5. 假设 以 数组 sequ(0..m 一 1) 存 放 循 环 队列 元 素 , 同 时 设 变量 rear 和 quelen 分 别 指示 
循环 队列 中 队 尾 元 素 和 内 含 元 素 的 个 数 。 试 给 出 此 循环 队列 的 队 满 条 件 , 并 写 出 相应 的 人 
队列 和 出 队列 的 算法 (在 出 队列 的 算法 中 要 返回 队 头 元 素 ) 。 

6. 假设 以 带头 结 点 的 环形 链表 表示 队列 ,并 且 只 设 一 个 指针 指向 队 尾 元 素 结 点 (注意 
不 设 头 指针 ) , 试 编写 相应 的 初始 化 队列 、 入 队列 、 出 队列 的 算法 。 


全 机 练习 3 


1. 设 单 链表 中 存放 个 字符 ,设计 一 个 算法 ,使 用 栈 判 断 该 字符 串 是 否 中 心 对 称 ,如 
abccba 即 为 中 心 对 称 字符 串 (根据 题目 填空 完善 程序 )。 

提示 : 先 用 create() 函 数 从 用 户 输入 的 字符 串 创建 相应 的 单 链 表 , 然 后 调用 judge() 函 
数 判 断 是 否 为 中 心 对 称 字符 串 。 在 judge() 函 数 中 先 将 字符 串 进 栈 ,然后 将 栈 中 的 字符 逐个 
与 单 链 表 中 字符 进行 比较 。 


井 include < stdio.h> 
# include < malloc.h> 
# define MaxLen 100 
typedef struct node 


{ 

char data; 

struct node * next; 
}cnode; 


cnode * create (char s[]) 
{ 
int I=0; 
Cnode *h, *p,*r; 
while (s[I]!= "\0') 


上 
p= (cnode * )malloc(sizeof(cnode)); 
p->data= s[I];p-> next= NULL; 
if (I==0) 
{ 
h=p; 
， /xr 始终 指向 最 后 一 个 结 
else 
{ 
r->next=p;r=p; 
} 
t+} 
上 
return h; 


int judge(cnode * h) 
{ 
char st[MaxLen]; 
int top= 0; 
cnode * p=h; 
while (p!= NULL) 
{ 
st[top] = p—> data; 
topt+; 
p=p->next; 


} 


p=h; 

while (p!= NULL) 
{ 
top——; 


if (p-> data== st[top]) 
p=p->next; 
else 
break; 
} 
if (p== NULL) 
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return 
else 
return 
} 
void main() 
{ 
char str[maxlen]; 
cnode *h; 
printf(" 输 入 一 个 字符 串 :"); 


scanf("%c", str); 


h= create( Vs 
if (judge(h)= = 1) 

printf("str 是 中 心 对 称 字 符 串 \n"); 
else 


printf("str 不 是 中 心 对 称 字符 串 \n"); 


人 

输出 : 

2. 设 一 个 算术 表达 式 中 包含 圆 括号 方 括号 和 花 括 号 3 种 类 型 的 括号 ,编写 一 个 算法 判 
断 其 中 的 括号 是 否 匹 配 。 

提示 : 本 题 使 用 一 个 运算 符 栈 st, 当 过 到 (、[ 或 {时 进 栈 , 当 遇 到 )、]、) 时 判断 栈 顶 是 否 
为 相应 的 括号 ,若是 退 栈 则 继续 执行 ,否则 算法 结束 。 

3. 设计 一 个 程序 ,演示 用 运算 符 优 先 法 对 算术 表达 式 求 值 的 过 程 。 

基本 要 求 : 以 字符 序列 的 形式 从 终端 输入 语法 正确 的 、 不 含 变量 的 整数 表达 式 。 利 用 
书 中 表 3. 1 给 出 的 运算 符 优先 关系 ,实现 对 算术 四 则 混合 运算 表达 式 的 求 值 ,并 仿照 书 中 
例 3. 1 演示 在 求 值 中 运算 符 栈 、 运 算数 栈 、 输 入 字符 和 主要 操作 的 变化 过 程 。 

测试 数据 3 * (7 一 2)。 


数组 和 字符 串 | 


本 章 学 习 要 点 

(1) 掌握 数组 的 逻辑 结构 定义 及 其 存储 结构 。 

(2) 掌握 特殊 数组 的 定义 ,存储 结构 及 其 基本 操作 的 实现 。 

(3) 熟悉 串 的 有 关 概 念 . 串 和 线性 表 的 关系 。 

(4) 掌握 串 的 各 种 存储 结构 ,比较 它们 的 优 、 缺 点 ,从 而 学 会 串 的 存储 结构 的 选择 。 

(5) 熟练 掌握 串 的 7 种 基本 操作 ,并 能 利用 这 些 基本 操作 实现 串 的 其 他 各 种 操作 。 

数组 是 最 常用 的 数据 类 型 之 一 ,几乎 所 有 的 程序 设计 语言 都 将 数组 类 型 设 定 为 加 有 数 
据 类 型 。 字 符 串 作为 一 种 变量 类 型 出 现在 越 来 越 多 的 程序 设计 语言 中 ,同时 也 产生 了 一 系 
列 与 字符 串 相 关 的 操作 。 字 符 串 和 数组 都 呈现 线性 结构 ,但 元 素 或 操作 具有 特殊 性 ,本章 重 
点 讨论 数组 和 字符 串 的 逻辑 结构 ,存储 结构 和 操作 。 


.1 数组 


在 数据 结构 中 ,数组 (array) 是 一 种 特殊 的 线性 表 , 表 中 的 数据 元 素 本 身 也 是 一 个 数据 
结构 , 即 元 素 的 值 可 以 再 分 解 。 与 一 般 的 线性 表 相 比 ,数组 进行 的 操作 有 结构 的 初始 化 、 销 
毁 , 存 取 元 素 和 修改 元 素 ,数组 一 般 不 做 插入 或 删除 操作 。 


4.1.1 数组 的 定义 与 操作 


和 线性 表 一 样 ,数组 是 由 同一 种 数据 类 型 的 数据 元 素 组 成 的 , 它 的 每 个 元 素 由 一 个 值 和 
一 组 下 标 确定 。 即 在 数组 中 ,对 于 每 组 有 定义 的 下 标 ,都 存在 一 个 与 之 相对 应 的 值 。 
一 维 数组 的 每 个 数据 元 素 由 一 个 值 和 一 个 下 标 确定 ， 


若 把 数组 元 素 的 下 标 顺 序 改 变 成 其 在 线性 表 中 的 序号 , 则 ~ 
一 维 数组 就 是 一 个 线性 表 。 图 4. 1 所 示 是 一 个 二 维 数组 ， nr| “” qm 
含有 m Xn 个 数据 元 素 ,每 一 个 元 素 由 值 a; 和 一 组 下 标 
(i,j)(i==0,1,2,3,…,m 一 13 j= 二 0,1,2,3,… sn 一 1) 来 确 Gnd Gaull 2 Gl 
定 。 每 组 下 标 (i,j ) 唯 一 对 应 一 个 数据 元 素 值 cy 。 图 4.1 二 维 数组 


数组 是 线性 表 的 推广 , 它 的 每 个 数据 元 素 也 是 个 线性 表 , 例 如 a;.;;1 是 a; 在 行 关 系 中 
的 直接 后 继 元 素 ; 而 ci+iv 是 as 在 列 关系 中 的 直接 后 继 元 素 。 所 以 ,上 面 的 数组 A 可 以 看 
成 一 个 线性 表 : 
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A 一 (aoyal ar) (k=m 一 1 或 n 一 1) 
其 中 每 一 个 数据 元 素 a; 是 由 第 i 行 元 素 组 成 的 一 维 数组 , 即 一 个 行 向 量 的 线性 表 。 
人 一 JJ 
或 w 是 由 第 j 列 元 素 组 成 的 一 维 数组 , 即 一 个 列 向 量 的 线性 表 。 
Qaj=(aorayrsadn1,j) (0 委 j 委 2 一 1) 
同样 ,可 以 把 ” 维 数组 也 看 成 一 个 线性 表 , 表 中 每 一 个 数据 元 素 是 一 个 "一 1 维 数组 。 
数组 通常 只 有 两 种 操作 : 
(1) 给 定 一 组 下 标 , 存 取 相 应 数据 元 素 ; 
(2) 给 定 一 组 下 标 , 修 改 相 应 数据 元 素 中 的 某 一 个 或 几 个 数据 项 的 值 。 


4.1.2 数组 的 顺序 存储 结构 


用 一 组 连续 的 存储 单元 来 依次 存放 数组 元 素 , 称 为 数组 的 顺序 存储 结构 。 由 于 一 组 连 
续 的 存储 单元 是 一 维 的 结构 ,而 多 维 数组 不 像 一 维 数组 那样 ,所 有 的 元 素 已 经 排列 成 一 个 线 
性 序列 ,所 以 要 把 多 维 数组 顺序 地 存储 到 一 维 顺序 的 存储 单元 中 ,就 必须 按 一 定 的 次 序 把 多 
维 数组 中 所 有 的 元 素 排 在 一 个 线性 序列 中 。 

因此 谈 到 数组 的 顺序 存储 结构 时 ,就 有 一 个 次 序 约定 的 问题 。 二 维 数组 元 素 间 的 顺序 
有 两 种 方法 : 一 种 是 按 行 的 升序 存储 元 素 , 称 为 以 行 序 为 主 序 的 存储 方式 ,如 图 4.2(a) 所 
示 ; 另 一 种 是 按 列 存储 元 素 , 称 为 以 列 序 为 主 序 的 存储 方式 ,如 图 4. 2(b) 所 示 。 在 扩展 
BASIC、PASCAL 和 C 高 级 语言 中 ,采用 的 是 以 行 序 为 主 序 存储 数组 中 的 数据 元 素 , 而 在 
FORTRAN 高 级 语言 中 , 则 以 列 序 为 主 序 存储 数组 中 的 数据 元 素 。 


ao0 有 ~ 
qol 
: 第 一 行 人 第 一 列 
Gowm-l 
Qm-10 
aio al 3 
11 
全 全 | 第 二 列 
SU 到 
Gm-1.0 i 
|》 第 m 行 qn 第 列 
cml, Gm-lorl 
(a) 以 行 序 为 主 序 (b) 以 列 序 为 主 序 


图 4.2 二 维 数组 的 两 种 存储 方式 


数组 的 顺序 存储 结构 的 优点 是 可 以 随机 存 取 数 组 元 素 。 只 要 知道 数组 元 素 的 下 标 值 ， 
就 可 以 通过 公式 计算 并 找到 该 数组 元 素 在 存储 器 中 的 相对 位 置 , 从 而 按 地 址 存 取 元 素 。 

下 面 介 绍 二 维 数组 中 数组 元 素 的 存储 位 置 计算 公式 。 

车 以 行 序 为 主 序 的 存储 方式 存储 ,假设 数组 及 列 、m 行 ,每 个 数组 元 素 占 用 s 个 存储 
单元 , 设 元 素 a; 在 存储 器 中 的 地 址 为 LOC(i,j),aw 的 存储 地 址 是 LOC(0,0), 即 二 维 数 


第 4 章 “” 数组 和 字符 串 


组 存储 的 起 始 位 置 , 也 叫 首 地 址 或 基地 址 。 由 于 as 位 于 第 i 二 1 行 .第 j 十 1 列 , 前 面 已 存放 
了 i 行 共 ixn 个 元 素 , 而 在 第 ;十 1 行 上 ,ay 元 素 前 面 有 j 个 元 素 , 所 以 它 前 面 共有 (i * nn 十 j) 
个 元 素 , 由 此 可 以 得 到 数组 中 任 一 元 素 a; 的 存储 地 址 为 : 


LOC(i,j) =LOC(0,0)+ (nx*it+j)*s (4.1) 
同样 ,对 于 按 列 序 为 主 序 的 存储 结构 ,数组 中 的 任 一 元 素 的 存储 地 址 为 : 
LOCGi,j) =LOC(0,0) + Gn*j+i)xs (4. 2) 


由 此 可 见 , 数 组 元 素 的 存储 位 置 是 其 下 标的 线性 函数 , 当 数组 下 标的 范围 确定 以 后 , 计 
算数 组 元 素 存 储 位 置 的 时 间 仅 取决 于 乘法 运算 的 时 间 , 因 此 , 存 取 数组 中 任 一 元 素 的 时 间 
相等 。 

具有 上 述 特点 的 存储 结构 称 为 随机 存储 结构 。 


4.1.3 矩阵 的 压缩 存储 方法 


在 科学 与 工程 应 用 中 ,经常 出 现 一 些 阶 数 很 高 的 矩阵 ,同时 在 矩阵 中 有 许多 零 值 (或 者 
是 值 相同 ) 的 元 素 。 为 了 节省 存储 空间 ,可 以 对 这 类 和 矩阵 进行 压缩 存储 。 所 谓 压 缩 存 储 , 是 
指 为 多 个 值 相同 的 元 素 只 分 配 一 个 存储 空间 ; 对 零 元 素 不 分 配 空间 。 

一 般 地 ,将 需要 压缩 存储 的 矩阵 分 为 特殊 矩阵 和 稀疏 和 矩阵。 


1. 特殊 和 矩阵 


若 值 相同 的 元 素 或 零 元 素 在 矩阵 中 的 分 布 有 一 定 的 规律 , 则 称 此 类 矩阵 为 特殊 矩阵 。 

下 面 讨论 几 种 特殊 矩阵 的 压缩 存储 方式 。 

1) 对 称 矩 阵 

若 ， 阶 矩阵 4 中 的 元 素 满足 下 列 性 质 

ajy=anx (0<i,j<n—1) 

则 称 为 对 称 矩 阵 , 如 图 4. 3 所 示 。 

对 称 和 矩阵 中 的 元 素 关于 主 对 角 线 对 称 ,所 以 可 以 为 每 一 对 对 称 
元 素 只 分 配 一 个 存储 空间 ,只 存储 矩阵 中 主 对 角 线 以 上 或 以 下 的 元 
素 , 即 将 n” 个 元 素 压缩 存储 到 nn 十 1)/2 个 空间 中 ,这 样 就 可 以 节 6 
约 近 一 半 的 存储 空间 。 ee 

假设 以 行 序 为 主 序 存储 对 角 线 ( 含 对 角 线 ) 以 下 的 元 素 ,并 以 一 
维 数组 MLn(n 十 1)/2J 作 为 n 阶 和 矩阵 A 的 存储 结构 , 则 MLA] 和 和 矩阵 元 素 a; 存在 一 一 对 应 
的 关系 : 


wm Ou 
-和 7 

ony 
we oo 


A Ps 


2 (4.3) 
> +i—l i<j 
Mf[n(n 十 1)/2] 为 n 阶 对 称 和 矩阵 A 的 压缩 矩阵 ,即将 n * n 个 元 素 压 缩 存储 到 n(n 十 
1)/2 个 存储 空间 中 ,其 存储 状况 如 图 4.4 所 示 。 
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MA 


Goo0 QI0 all 0 es An-10 各 -ln 


f=0 和 2 3 n(n-1)/2 n(nt+1)/2-1 
图 4.4 对 称 和 矩阵 的 压缩 存储 


2) 三 角 和 矩阵 

以 对 角 线 划分 ,三 角 和 矩阵 有 上 三 角 和 矩阵 与 下 三 角 和 矩阵 两 种 。 若 n 阶 方 阵 的 对 角 线 右上 
方 ( 含 对 角 线 ) 的 元 素 均 为 常数 c 或 零 的 阶 矩 阵 , 称 为 下 三 角 和 矩阵 。 反 之 , 称 为 上 三 角 和 矩 
阵 , 如 图 4.5 所 示 。 


do aol tonl aoo 0 0 
0 an qn-l ao on 0 
0 0 0 0 
0 … arinl ro rh Gn 
(a) 上 三 角 矩 阵 (b) 下 三 角 和 矩阵 
图 4.5 三 角 和 矩阵 


三 角 和 矩阵 的 压缩 存储 方式 同 对称 矩 阵 的 存储 方式 类 似 ,除了 和 对 称 和 矩阵 一 样 只 存储 其 
上 三 角 或 下 三 角 中 的 元 素 之 外 ,再 加 一 个 存储 常数 c 的 存储 空间 即 可 。 
3) 带 状 矩阵 d 列 
除了 上 述 特殊 矩阵 外 ,还 有 一 种 较为 复杂 的 矩阵 , 称 (二 
为 带 状 矩 阵 或 对 角 甜 阵 , 即 在 ” 阶 矩 阵 中 ,全 部 非 零 元 素 Se 
都 集中 在 以 对 角 线 为 中 心 的 带 状 区 域 中 ,如 图 4. 6 所 示 。 "| ~ 1 行 
对 这 种 矩阵 也 可 以 按 某 个 原则 (或 以 行为 主 ,或 以 对 角 线 NN 
的 顺序 ) 将 其 压缩 存储 到 一 维 数组 中 。 
在 所 有 的 特殊 矩阵 中 ,由 于 非 零 元 素 的 分 布 都 有 一 本 
个 明显 的 规律 ,因而 都 可 将 其 压缩 存储 到 一 维 数组 中 ,并 ”图 4.6 带 状 矩阵 (对 角 和 矩阵 ) 
找到 每 个 非 零 元素 在 一 维 数组 中 的 对 应 关系 。 


主 对 角 线 


2. 稀疏 和 矩阵 


如 果 一 个 矩阵 中 有 很 多 元 素 是 零 ,而 且 非 零 元 素 的 分 布 没有 规律 , 则 该 矩阵 称 为 稀疏 拢 
阵 。 如 果 用 一 般 的 存储 方法 表示 稀 朴 矩阵 ,就 会 存储 大 量 的 零 元 素 , 这 将 造成 存储 空间 的 浪 
费 。 下 面 讨 论 稀疏 矩阵 的 压缩 存储 方法 。 

1) 三 元 组 顺序 表 

用 一 个 线性 表 来 表示 稀疏 矩阵 ,线性 表 中 的 每 个 结 点 对 应 稀疏 和 矩阵 的 一 个 非 零 元 素 ,其 
中 包括 三 个 域 ,分 别 为 非 零 元 素 的 行 下 标 、 列 下 标 和 值 。 结 点 仍 按 矩 阵 的 行 优先 顺序 排列 ， 
称 该 线性 表 为 三 元 组 表 。 表 中 结 点 类 型 定义 如 下 : 


井 define MAX 10 
typedef struct 


{int i,j; 
elemtype v; 
}node; 
typedef struct 
{int m,n,t; 
node data[ MAX]; 
}mat; 
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其 中 ,MAX 为 非 零 元 素 个 数 的 最 大 值 ; i,j 为 非 零 元 素 的 行列 下 标 ,v 为 元 素 值 ; node 为 线 
性 表 中 结 点 的 类 型 名 ; m、n、t 分 别 为 稀 朴 矩阵 的 行 数列 数 、 非 零 元 素 个 数 ，data 为 存放 三 
元 组 表 的 数组 ; mat 为 稀疏 和 矩阵 类 型 名 。 

一 个 三 元 组 (i,j ,ai ) 唯 一 地 确定 矩阵 的 非 零 元 。 由 此 , 稀 玻 矩阵 可 由 表示 非 零 元 的 三 
元 组 及 其 行列 数 唯 一 确定 。 可 以 用 数组 表示 三 元 组 表 , 如 a 是 mat 类 型 的 变量 ,表示 矩阵 
4,a. data 是 矩阵 4 的 三 元 组 表 , 如 图 4.7 所 示 。 


0 0 6 0 
4=|2 3 0 0 
0 0 0 0 

0 0 0 0 

(a) 稀 玻 矩 阵 4 

图 4.7 


已 


wowaoa- a 


各 已 可 各 
oc oo0c 
家 wwnb 一 口 
om ul~ 
bwbewowa 


(b) 三 元 组 表 a.data 
稀 朴 矩阵 及 三 元 组 表 


注意 : 表 中 a. data[0] 的 i,j ,wv 值 分 别 存储 稀 朴 矩阵 的 行 数列 数 和 非 零 元 素 的 个 数 。 
在 三 元 组 顺序 表 的 压缩 存储 结构 下 如 何 进 行 某 些 和 矩阵 运算 呢 ? 下 面 以 矩阵 的 转 置 为 例 


讨论 。 


求 矩 阵 的 转 置 是 一 种 最 简单 的 矩阵 运算 。 对 于 一 个 m Xn 的 矩阵 4 , 它 的 转 置 矩 阵 B 
是 一 个 nXm 的 矩阵 , 且 5; 二 aj 1 受过 1 委 ) 入 2 例如 图 4.7(a) 中 的 稀 朴 矩阵 4 和 
图 4.8(a) 中 的 稀 朴 矩阵 也 互 为 转 置 矩阵 ,b 是 mat 分 量 。 


条 和， 全- 训 
0 "0 230 
0 6 0 0 
B= 
0 0 0 0 
0 0 0 0 
7 0 0 0 
(a) 稀 政 和 矩 阵 B 


0 交趾 旋 

ofe lsise 
0 1| 1 1 3 
0 Z| yy | 3 | 

3 .2 3: | :3 
y 4|3|2|56 
a 5| s|s|2 
i 6| 6 |1|7 


(b) 稀 芍 矩阵 8 的 三 元 组 表 


图 4.8 稀 朴 矩阵 4 的 转 置 矩阵 吾 及 其 三 元 组 表 


在 采用 三 元 组 表 表示 法 的 前 提 下 .如何 实现 稀疏 矩阵 的 转 管 运算 呢 ? 


算法 思路 : 


Qz 将 两 个 矩阵 的 行 数 和 列 数 相 互 交换 ; 
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@ 将 每 个 三 元 组 中 的 i 和 j 相互 调换 ; 

@ 重 排 三 元 组 之 间 的 次 序 便 可 实现 矩阵 的 转 置 ,即使 b. data 中 的 三 元 组 以 B 的 行 ( 即 
A 的 列 ) 为 主 序 依 次 排列 。 

为 此 ,可 按 下 面 的 方法 实现 矩阵 转 置 。 

按照 矩阵 A 的 列 序 来 进行 转 置 运算 。 也 就 是 首先 寻找 a. data 中 的 第 一 列 的 所 有 三 元 
组 ,将 其 (i,j ,v) 改 为 (j ,i,v) 后 依次 存放 到 b. data 中 ,作为 转 置 算 阵 B 的 第 一 行 的 非 零 元 
素 所 对 应 的 三 元 组 。 然 后 在 a. data 中 寻找 第 二 列 的 所 有 三 元 组 ,将 其 (i,j ,v) 改 为 (j,i,v) 
后 依次 存放 在 b. data 中 ,作为 转 置 矩阵 吾 的 第 二 行 的 非 零 元 素 所 对 应 的 三 元 组 ,以 此 类 推 。 
为 了 找到 A 的 每 一 列 中 所 有 的 非 零 元 素 ,需要 对 其 三 元 组 a. data 从 第 一 行 起 整个 扫描 一 
遍 , 由 于 a. data 是 以 A 的 行 序 为 主 序 来 存放 每 个 非 零 元 的 ,由 此 得 到 的 恰 是 b. data 应 有 的 
顺序 。 其 具体 算法 描述 如 算法 4.1 所 示 。 

算法 4.1 稀 玻 矩阵 转 置 算 法 。 


mat *zzjz(mat *a) 

| 

int am, bn, col; 

mat x*b; // 转 置 后 的 矩阵 b 
b= (mat * )malloc(sizeof(mat)); 

b->nu=a->m; 

b->m=a->n; 


b->tu=a->t; //asb 和 矩阵 行列 交换 
bn=0; 
for (col =1;col <=a—>n;col+t+) // 按 a 的 列 序 转 置 
for(am=1;am<=a—>t;amt+) // 扫 描 整 个 三 元 组 表 
if(a—> data[am].j== col) // 列 号 为 col 是 转 置 


b->data[bn].i=a-> data[am].j; 
b-> data[bn].j=a->data[am].i; 
b->data[bn].v=a->data[am].vi 
bnt+ //b. data 中 的 结 点 序号 加 1 
’ 
return b; // 返 回转 置 矩阵 的 指针 


该 算法 的 时 间 耗 费 主 要 是 在 col 和 am 的 两 重 循环 中 ,所 以 算法 的 时 间 复 杂 度 为 O(n x*1) 
(n 表示 a. n,t 表示 a.t), 即 和 A 的 列 数 与 非 零 元 素 的 个 数 的 乘积 成 正比 。 
如 果 用 二 维 数组 来 表示 矩阵, 一般 总 可 用 算法 : 
for (j=1;j<=n;j++) 
for (i=1;i<=m;it+) 
b[j][i] =a[lil[j]; 
来 实现 矩阵 的 转 置 运算 ,其 时 间 复杂 度 是 OCm * w)。 
由 于 上 述 算法 主要 是 在 二 重 循 环 内 完成 的 , 当 非 零 元 个 数值 + 一 m *n 时 ,算法 4.1 的 
时 间 复 杂 度 为 O(m x n”)。 显 然 , 此 时 算法 4. 1 的 时 间 复 杂 度 比 OCm * zz) 还 差 。 可 见 该 算 
法 虽然 节省 了 空间 ,但 时 间 复 杂 度 却 提高 了 。 所 以 一 般 上 述 转 置 算法 只 适用 于 当 + 作 m *n 
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的 情况 。 在 许多 数据 结构 的 资料 中 都 讲解 了 改进 后 的 快速 转 置 算法 。 这 一 算法 是 在 适当 增 
加 存储 单元 后 ,用 时 间 复 杂 度 为 O(n 十 ) 完 成 的 矩阵 转 置 。 

快速 转 置 算法 思想 是 按 a 中 三 元 组 次 序 转 置 , 转 置 结果 放 和 b 中 恰当 位 置 。 此 算法 的 
关键 是 要 预先 确定 a 中 每 一 列 第 一 个 非 零 元 在 b 中 位 置 , 这 就 需要 先 求 得 a 的 每 一 列 中 非 
零 元 个 数 。 

num[col]: 表示 a 中 第 col 列 中 非 零 元 个 数 。 

cpot[col]: 表示 a 中 第 col 列 第 一 个 非 零 元 在 b 中 位 置 。 显 然 有 : 


cpot[1]=1; 

cpot[col] = cpot[col —1] + num[col—1]; //(2<col<a[0].j) 

算法 4.2 稀 琉 矩阵 的 快速 转 置 。 

void fasttrans(mat *a,mat *b) // 对 a 进 行 快 速 转 置 ,结果 存放 在 b 中 


{ 
int p,q,col,k; 
int num[ MAX + 1],cpot[MAX+1]; 
b->m=a->n; b->n=a->nm; b->t=a->t; 
if(b->t<=0) 
printf("a= 0\n"); 
for(col =1;col <=a—>n;++col) 


num[ col] = 0; 


for(k=1;k<=a->tu;+t+k) // 求 a 中 每 一 列 非 零 元 个 数 
++num[a 一 > data[k].j]; 
cpot[1] =1; 


for(col =2;col<=a->ni++col) 
cpot[col] = cpot[col- 1] +num[col -1]; // 
for(p=1;p<=a->t;++p) 
{ 
col =a->data[p].j; 
q= cpot[col]; // 由 列 号 直接 求 得 在 b 中 位 置 
b->data[q].i=a-> data[p].j; 
b->data[q].j=a-> data[p]. i; 
b->data[q].v=a—-> data[p].v; 
++cpot[col]; 


} 


稀 吏 和 矩阵 的 快速 转 置 算 法 的 时 间 复 杂 度 醋 (n) 二 O(a 的 列 数 n 十 非 零 元 个 数 1) ,车 1 与 
m Xn 同 数量 级 , 则 T(n) 二 O(m Xn)。 

2) 行 逻 辑 链接 的 顺序 表 

为 了 方便 某 些 矩 阵 运 算 , 常 常 在 按 行 优先 存储 的 三 元 组 表 中 ,加 入 一 个 行 表 来 记录 稀疏 
矩阵 中 每 行 的 非 零 元 素 在 三 元 组 表 中 的 起 始 位 置 。 当 将 行 表 作为 三 元 组 表 的 一 个 新 增 属性 
加 以 描述 时 ,就 得 到 了 稀 玻 矩阵 的 另 一 种 顺序 存储 结构 : 行 逻 辑 链接 的 顺序 表 。 

其 类 型 描述 为 : 


# define MAX // 最 大 可 能 的 非 零 元 素 个 数 +1 
# define MAXROW // 最 大 可 能 的 稀 朴 矩阵 行 数 +1 


算法 与 数据 结构 (第 三 版 ) 


typedef struct 
{ 

int 

elemtype v; 
}node; 
typedef struct 
{ 

int m,n,t; 
node data[ MAX]; 
int rpot[ MAXPOW]; // 行 表 , 应 保证 m<= MAXPOW 
}matrow; 


显然 有 : 
rpot[1]=1; 


rpot[ 让 二 rpot[i 一 1] 十 第 i 一 1 行 非 零 元 素 的 个 数 

行 逻辑 链接 的 顺序 表 这 种 表示 方法 对 实现 两 个 矩阵 相 乘 具有 优越 性 。 

关于 稀 芍 矩阵 的 乘法 请 读者 参阅 相关 资料 进一步 理解 。 

3) 十 字 链 表 

上 述 求 稀 牙 和 矩阵 的 转 置 运 算 中 ,用 三 元 组 表 ( 顺 序 表 ) 的 方法 可 以 节省 内 存 空 间 并 加 快 
运算 速度 。 但 在 矩阵 的 男 一 些 运算 过 程 中 ,如 和 矩阵 的 加 法 C=4 十 中, 若 稀 玻 矩阵 的 非 零 元 
素 位 置 发 生变 化 ,将 会 引起 数组 中 元 素 过 多 的 移动 。 此 时 ,采用 链表 存储 结构 (十 字 链 表 ) 比 
用 三 元 组 表 更 好 ,其 插入 和 删除 操作 也 更 方便 。 

十 字 链 表 是 稀 玖 矩阵 的 男 一 种 表示 方法 。 在 链表 中 ,每 个 非 零 元 可 用 一 个 结 点 表示 ,每 
个 结 点 由 五 个 域 组 成 ,其 中 , 行 域 i、 列 域 j、 值 域 v 分 别 表 示 非 零 元 素 的 行 下 标 、 列 下 标 和 
值 ; 向 右 域 right 用 来 链接 同一 行 中 下 一 个 非 零 元 素 的 结 点 ,向 下 域 down 用 以 链接 同一 列 
中 下 一 个 非 零 元 素 的 结 点 。 其 结 点 结构 如 图 4. 9(b) 所 示 。 稀 玻 矩阵 中 同一 行 中 的 非 零 元 
通过 向 右 域 right. 链 接 成 一 个 行 链表 。 同 一 列 中 的 非 零 元 也 通过 向 下 域 down, 链 接 成 一 个 
列 链表 。 表 中 每 一 个 非 零 元 既是 第 i 个 行 表 中 的 结 点 ,又 是 第 j 个 列表 中 的 结 点 ,整个 稀疏 
和 矩阵 用 一 个 十 字 交 叉 的 链表 结构 表示 ,所 以 称 十 字 链 表 。 用 两 个 一 维 数组 分 别 存储 行 链 表 
的 头 指针 和 列 链表 的 头 指针 ,从 头 指针 开始 , 顺 着 行 链 表 或 列 链表 查找 矩阵 元 素 。 和 矩阵 A 
和 其 十 字 链 表示 例如 图 4.9(a) 和 图 4. 9(c) 所 示 。 

采用 十 字 链 表 表 示 稀 疏 矩 阵 时 ,由 于 需要 额外 的 存储 链 域 空间 , 且 还 要 有 行 、 列 指针 数 
组 ,所 以 在 十 字 链 表 中 ,只 有 当 非 零 元 素 不 超过 总 元 素 个 数 的 20% 时 才 可 能 比 一 般 的 数组 
表示 方法 节省 存储 空间 。 

十 字 链 表 的 结 点 类 型 定义 如 下 : 


typedef struct node 
{int i,j,v; 
struct node * down, * right; 
}szjd; 
下 面 是 十 字 链 表 的 建立 算法 。 
算法 步骤: 
将 行 、 列 指针 数组 置 空 。 假 设 闷 ,” 分 别 是 行 指针 和 列 指针 数组 ,hs,ls 是 指向 存放 
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8 0 0 行 列 值 
由 | Ti 
5 0 6 向 下 | down | right | 向 右 
(a) 稀 芍 矩阵 4 (b) 结 点 结构 
[mm 
1|1|8 
人 
2 六 由 和 
”| 人 
和 人 
[|4|115 4|3156 
人 | 和 A | ^ 
(0) 十 字 链 表示 例 
图 4.9 稀 玖 矩阵 A 及 十 字 链 表 


矩阵 行 数 和 列 数 变量 的 指针 变量 。 
@ 输入 三 元 组 , 若 行 下 标 或 列 下 标 为 0 时 , 则 表示 输入 完毕 ,算法 结束 ,否则 生成 p 结 
点 ,并 把 行 、 列 、 值 域 分 别 置 为 i,j ,wv。 
@ 把 p 结 点 插入 到 第 x 行 链表 中 。 
@ 把 p 结 点 插入 到 第 y 列 链表 中 ,转向 步骤 @。 
算法 4.3 稀 玖 和 矩阵 的 十 字 链 表 建 立 算法 。 


int szlbcreat(szjd *m[],szjd *n[],int *hs,int *1s) 


| 

int i,j,v,k,ms,ns; 

szjd x* p= NULL, * q= NULL; 

ms=ns=0; 

scanf("% dg%d", gms, Sns); 

for(k=0;k<ms;k++) 
m[k] = NULL; 

for(k=0;k<ns;k++) 
n[k] = NULL; 

关 hs =ms7 

x*xls=ns; 

while(1) 

{ 


scanf(" $d%d%sd", &i,&j, &v); 


if(i>ms||j>ns) 
continue; 

if(i<=0||j<=0) 
break; 
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q= (szjd * )malloc(sizeof(szjd)); 
-> > > Ye 
q—> down = q—> right = NULL; 


p=m[i-1]; 
if(p== NULL| |p->j>j) 
{ 
q->right=p; 
mi-1]=q; 
} 
else 
{ 
(=> j== 
{ 
mi-1]=q; 
free(p); 
} 
else 
while(p—> right) 
p=p->right; 
p->right= gq; 
} 
} 
p=n[j-1]; 


if(p== NULL| |p—->i>i) 
{ 


q->down=p; 
n[j-1]=q; 
} 
else 
{ 
if(p->i==i) 
{ 
mj-1]=q; 
free(p); 
上 
else 
{ 
while(p—> down) 
p=p-> down; 
Pp->down=q; 
} 
} 
} 
return 1; 
} 


该 算法 时 间 复 杂 度 是 O(+ Xs) ,其 中 + 为 非 零 元 素 的 个 数 , 一 max{m ,n})。 
在 用 十 字 链 表 表 示 稀 玻 矩阵 时 ,应 如 何 实现 矩阵 4 和 B 相 加 的 问题 ,请 读者 参阅 有 关 
资料 完成 。 
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人 2 字符 串 


4.2.1 字符 串 的 定义 与 操作 
字符 串 (string ,简称 串 ) 就 是 一 组 由 常用 的 字符 组 成 的 有 限 序列 ,一 般 记 为 ; 


S 一 coc…c 1 (之 0) 


其 中 c;(0<i<n 一 1) 可 以 是 字母 .数字 或 其 他 字符 。 
1. 字符 串 有 关 术 语 


(1) 串 名 : 串 的 名 字 , 如 上 式 中 的 S。 

(2) 串 的 值 : 用 成 对 的 单 引 号 括 起 来 的 字符 序列 是 串 的 值 。 成 对 的 单 引号 本 身 仅 是 串 
值 的 标记 ,不 包含 在 串 中 , 它 的 作用 是 避免 串 与 常数 或 标识 符 混淆 。 例 如 ,'123' 是 数字 字符 
串 , 它 与 常数 123 不 同 ,又 如 'xl' 是 长 度 为 2 的 字符 串 ,而 xl 通常 表示 一 个 标识 符 。 注 意 ,在 
C 语言 中 ,用 单 引号 引起 来 的 单个 字符 与 单个 字符 的 串 是 不 同 的 ,如 'a' 与 "a" 两 者 是 不 同 的， 
前 者 表示 单个 字符 ,而 后 者 表示 字符 串 。 

(3) 串 的 长 度 : 串 中 字符 的 数目 称 为 串 的 长 度 。 零 个 字符 的 串 为 空 串 (null string) ， 
它 的 长 度 为 零 。 

(4) 子 串 和 主 串 : 串 中 任意 个 连续 的 字符 组 成 的 序列 称 为 该 串 的 子 串 。 包 含 子 串 的 串 
相应 地 称 为 主 串 。 特 别 地 , 空 串 是 任意 串 的 子 串 ,任意 串 是 其 自身 的 子 串 。 

(5) 串 的 位 置 : 字符 在 序列 中 的 序号 为 该 字符 在 串 中 的 位 置 。 子 串 在 主 串 中 的 位 置 则 
以 子 串 的 第 一 个 字符 在 主 串 中 的 位 置 来 表示 。 

例如 ,sl、s2、s3 为 如 下 三 个 串 : sl 二 '] have a dog'; s2 一 'have'; s3 王 "dog'… 则 它们 的 长 
度 分 别 为 12、4、3; 串 s3 是 sl 的 子 串 , 子 串 s3 在 sl 中 的 位 置 为 10, 也 可 以 说 sl 是 s3 的 主 
串 ; 串 s2 不 是 sl 的 子 串 ; 串 s2 和 s3 不 相等 。 

(6) 两 个 串 相等 : 当 两 个 串 的 长 度 相等 ,并 且 各 个 对 应 位 置 的 字符 都 相等 时 才 相 等 。 
例如 上 例 中 的 串 s1,s2,s3 都 是 不 等 的 。 

(7) 空格 串 : 由 一 个 或 多 个 空格 组 成 的 串 称 为 空格 串 ( 请 注意 ,此 处 不 是 空 串 ), 它 的 长 
度 不 为 0。 如 ' “' 是 空格 串 ,长 度 为 2。 

(8) 空 串 : 不 含 任何 字符 的 串 , 它 的 长 度 为 0。 为 了 清晰 起 见 ,以 后 用 符号 "来 表示 空 串 。 

可 用 二 元 组 的 形式 (D ,R) 来 定义 字符 串 ( 或 串 ) : 

string=(D.,R) 
其 中 : D={a;la; ECHARACTER,i=1,2,…,n,n 宕 0},R=N,N={(a; 1ai) Naii, 
ai ED,i=2,3,.,n), 

显然 , 串 的 逻辑 结构 和 线性 表 极 为 相似 ,区 别 仅 在 数据 元 素 集合 D 的 定义 上 。 串 的 数 
据 对 象 是 字符 集 CHARACTER ,元 素 之 间 的 关系 满足 线性 关系 。 


2. 字符 串 的 基本 操作 定义 
字符 串 的 基本 操作 常常 以 串 或 子 串 为 单位 ,而 不 是 以 一 个 字符 为 单位 ,常用 的 字符 串 的 
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基本 操作 有 下 列 7 种。 为 了 叙述 简便 起 见 ,假设 本 节 中 的 s,t,v,a,b,c 和 d 都 是 串 名 ,并 且 
a,b,c 和 d 的 值 分 别 为 'BEI','JING',… 和 'BEIJING '。 

1) 赋值 操作 : Assign(s,t) 和 Create(s,ss) 

其 中 ,t 为 串 名 ,ss 为 字符 序列 。Create(s,ss) 的 操作 结果 为 设 定 了 一 个 串 s, 其 值 为 字 
符 序列 ss; Assign(s,t) 的 操作 结果 是 将 串 t 的 值 赋 给 串 s。 

例如 ,执行 Assign(s,d) 的 操作 之 后 ,s 的 值 为 'BEIJING'。 

2) 判 相等 函数 : Equal(s,t) 

若 串 s 和 串 t 相等 , 则 返回 函数 值 ( 即 运算 结果 )1, 否 则 返回 函数 值 0。s 和 + 可 以 是 非 
空 串 ,也 可 以 是 空 串 。 

3) 求 串 长 函数 : Len(s) 

返回 函数 值 为 串 s 中 字符 的 个 数 , 若 s 是 一 个 空 串 , 则 其 函数 值 为 0。 

4) 连接 函数 : Concat(s,t) 

串 s 和 串 t 的 连接 是 把 t 的 字符 序列 紧 接 在 s 的 字符 序列 之 后 构成 一 个 新 的 字符 序列 ， 
从 而 产生 一 个 新 的 串 ,作为 函数 值 返回 。 

例如 ,如果 s='hand',t='work' ,那么 ,Concat(s,t 的 返回 值 为 新 串 'handwork '。 

5) 求 子 串 函 数 : SubStr(Cs,start,len) 

若 0 二 start 亿 length(s) 一 1 且 0 受 len 委 length(s) 一 start 十 1, 则 返回 函数 值 为 从 串 s 中 
第 start 个 字符 起 ,长 度 为 len 的 连续 字符 序列 ,否则 返回 一 个 特殊 的 串 常量 。 

例如 ,SubStr(d,0,3) 返 回 新 串 'BEI' ,SubStr(d,4,0) 返 回 空 串 "。 

6) 定位 函数 : Index(s,t) 

车 在 主 串 s 中 存在 和 + 相等 的 子 串 . 则 函数 值 为 s 中 第 一 个 这 样 的 子 串 在 主 串 s 中 的 位 
置 ,否则 函数 值 为 一 1。 注 意 ,在 此 处 t+ 不 能 是 空 串 。 

例如 ,Index(d,b) 返 回 子 串 位 置 3,Index(d,c) 返 回 函 数值 一 1。 

7) 替换 操作 : Replace(s,t,v) 

操作 结果 是 以 串 v 替换 所 有 在 串 s 中 出 现 的 和 非 空 串 t 相等 的 不 重生 的 子 串 。 

例如 , 设 s= 王 'bbabbabba',t='ab',v='c" 则 Replace(s,t,v) 的 操作 结果 为 s='bbcbcba'。 

其 他 的 串 操作 还 有 下 述 两 个 。 

1) 插入 操作 : Insert(s,pos.t) 

当 0 二 pos 夺 length(s) 时 ,在 串 s 的 第 pos 个 字符 之 前 插入 串 t。 

2) 删除 操作 : Delete(s,pos,len) 

当 0 三 pos 和 length(s) 一 1 且 1 三 len 志 length(s) 时 ,从 串 s 中 删除 从 第 pos 字符 起 长 度 
为 len 的 子 串 。 

有 些 操作 还 可 以 用 其 他 基本 操作 来 实现 。 例 如 可 利用 判 等 . 求 串 长 和 求 子 串 等 实现 定 
位 函数 index(s,t)。 下 面 以 算法 index(s;,t) 为 例 说 明 其 实现 方法 。 

算法 的 基本 思想 是 : 在 主 串 s 中 从 第 ii 的 初 值 为 0) 个 字符 起 , 取 长 度 与 串 t 相等 的 子 
串 和 +t 相 比较 。 若 相等 , 则 求 得 函数 值 为 i; 否则 i 增加 1, 直 至 串 s 中 不 存在 和 + 相等 的 子 
串 为 止 ,如 算法 4.4 所 示 。 

算法 4.4 定位 算法 。 


int Index(string * s,string *t) 
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// 若 串 s 中 存在 和 + 相等 的 子 串 , 则 返回 第 一 个 子 串 在 主 串 中 的 位 置 ,否则 返回 一 1 
int n= length(s); 
int m= length(t); 
int i=0; 
if(m== 0) 
return 一 1; 
while(i<= (n 一 m)) 
{ 
if((equal(substr(s, ivm),t)) 
return i; 
++ > 
} 
return 一 1 


} 


4.2.2 字符 串 的 存储 结构 


串 的 存储 方式 取决 于 对 串 所 进行 的 运算 。 如 果 在 程序 设计 语言 中 , 串 只 是 作为 输入 输 
出 的 常量 出 现 , 则 只 需 作 为 一 个 字符 的 序列 存储 即 可 。 但 在 多 数 非 数值 处 理 程序 中 , 串 也 是 
操作 的 对 象 , 在 程序 执行 的 过 程 中 , 它 的 值 可 变 。 其 也 和 在 程序 中 出 现 的 其 他 类 型 的 变量 一 
样 , 可 以 赋 给 它 一 个 串 变 量 名 ,在 对 串 进行 操作 时 ,可 通过 变量 名 访问 其 值 。 此 时 ,有 两 种 存 
储 串 的 方法 : 一 种 是 将 串 设 计 成 一 种 结构 类 型 ,例如 在 C 语言 中 , 串 是 字符 型 的 数组 ,以 \0' 
表示 串 的 结束 ,从 串 名 可 直接 访问 到 串 值 , 串 值 的 存储 分 配 是 在 编译 时 完成 的 ; 另 一 种 是 串 
值 的 存储 分 配 是 在 程序 运行 时 完成 的 ,在 串 名 和 串 值 之 间 需 建立 一 个 对 照 表 , 这 个 对 照 表 称 
为 串 ( 变 量 ) 名 的 存储 映像 ,对 串 值 的 访问 通过 串 名 的 存储 映像 进行 。 前 一 种 存储 方式 称 为 
静态 存储 结构 ,后 一 种 称 为 动态 存储 结构 。 下 面 对 串 的 这 两 种 存储 结构 分 别 进行 讨论 。 


1. 静态 存储 结构 (顺序 存储 方式 ) 


类 似 于 线性 表 的 顺序 存储 结构 ,用 一 组 地 址 连续 的 存储 单元 存储 串 的 字符 序列 。 由 于 
一 个 字符 只 占 1 字 节 ,而 现在 大 多 数 计算 机 的 存储 器 地 址 是 采用 的 字 编 址 ,一 个 字 ( 即 一 个 
存储 单元 ) 占 多 字 节 ,因此 顺序 存储 结构 方式 有 两 种 。 

1) 非 紧缩 格式 

这 种 方式 是 以 一 个 存储 单元 为 单位 ,每 个 存储 单元 仅 存放 一 个 字符 。 这 种 存储 方式 的 
空间 利用 率 较 低 ,如 一 个 存储 单元 有 4 字 节 , 则 空间 利用 率 仅 为 25%。 但 这 种 存储 方式 不 
需要 分 离 字符 ,因而 程序 处 理 字 符 的 速度 高 。 图 4. 10 是 这 种 结构 的 示意 图 。 

用 字符 数组 存放 字符 串 时 ,其 结构 用 C 语言 定义 如 下 : 


间 define maxnum < 人 允许 的 最 大 的 字符 数 > typedef struct { 
char ch[ maxnum]; 


int length; // 串 长 度 
} string; // 串 类 型 定义 
2) 紧缩 格式 


紧缩 格式 的 实现 方法 是 把 数组 的 几 个 分 量 紧缩 到 一 个 字 存 储 单元 里 , 即 一 个 字 节 存储 
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一 个 字符 。 这 种 存储 方式 可 以 在 一 个 存储 单元 中 存放 多 个 字符 ,充分 地 利用 了 存储 空间 。 
但 在 进行 串 的 运算 时 , 若 要 分 离 某 一 部 分 字符 , 则 变 得 非常 麻烦 ,如 图 4. 11 所 示 。 假 设 一 个 
字 存 储 单元 可 存放 & 个 字符 , 则 长 度 为 的 串 只 占 n/k 个 存储 单元 (图 4.11 是 n= 二 15,k 二 4 
的 例子 )。 


图 4.10 串 值 存储 的 非 紧缩 格式 示例 图 4.11 串 值 存储 的 紧缩 格式 示例 


如 果 计 算 机 采用 的 是 字 节 编 址 存储 器 , 则 可 以 单字 节 格 式 存放 , 即 一 个 字 节 ( 八 位 二 进 
制 数码 ) 存 储 一 个 字符 ,此 时 既 节省 空间 ,又 方便 处 理 。 

当 用 顺序 方式 存储 串 值 时 .由 于 在 串 类 型 的 定义 中 预先 规定 了 一 个 串 允 许 的 最 大 长 度 
(一 般 情 况 下 处 理 的 串 , 其 长 度 变 化 范围 很 大 ), 则 当 多 数 串 长 较 小 时 ,空间 的 利用 率 很 低 。 
另 一 方面 ,由 于 限定 了 串 的 最 大 长 度 , 使 串 的 某 些 操作 ,如 连接 ,替换 等 受到 很 大 限制 或 者 产 
生 错 误 的 结果 (参见 4. 2. 3 节 的 讨论 ) 。 


2. 动态 存储 结构 


如 前 所 述 , 串 的 各 种 运算 与 串 的 存储 结构 有 着 很 大 的 关系 。 在 随机 取 子 串 时 ,顺序 存储 
方式 操作 起 来 比较 方便 ,而 对 串 进行 插入 \ 删 除 等 操作 时 ,就 会 变 得 很 复杂 。 这 时 就 有 必要 
采用 串 的 动态 存储 方式 。 

串 的 动态 存储 方式 有 链 式 存储 结构 和 堆 存 储 结构 两 种 。 

1) 链 式 存储 结构 

与 线性 表 的 链 式 存储 结构 类 似 , 串 值 也 可 以 采用 链 式 存储 。 串 的 链 式 存 储 结构 中 每 个 
结 点 包含 字符 域 和 结 点 链接 指针 域 , 字 符 域 用 于 存放 字符 ,指针 域 用 于 存放 指向 下 一 个 结 点 
的 指针 ,因此 , 串 可 用 单 链表 表示 。 

用 链表 存放 字符 串 时 ,其 结构 用 C 语言 定义 如 下 : 

typedef struct node{ 

char ch; 


struct node * next; 
} slstrtype; 
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用 单 链表 存放 串 ,每 个 结 点 仅 存储 一 个 字符 ,如 图 4. 12(a) 所 示 ,因此 ,每 个 结 点 的 指针 
域 所 占 空间 比 字符 域 所 占 空 间 大 得 多 。 为 了 提高 空间 的 利用 率 ,可 以 使 每 个 结 点 存放 多 个 
字符 ,如 图 4. 12(b) 所 示 , 每 个 结 点 存放 了 4 个 字符 。 由 于 串 长 不 一 定 是 结 点 大 小 的 整 倍 
数 ,因此 链表 的 最 后 一 个 结 点 不 一 定 全 被 串 值 占 满 ,此 时 通常 补 上 # 或 其 他 非 串 值 字符 ( 通 
常 # 不 属于 串 的 字符 集 ,是 一 个 特殊 的 符号 )。 
head 


Lalslclo 二 -| srlclal 十 -| # | # | # | 和 
(a) 结 点 大 小 为 4 的 链表 


head 


| -| A -| B -| C ae -| | 人 
(b) 结 点 大 小 为 1 的 链表 
图 4.12 串 值 的 链表 存储 方式 


为 便于 进行 串 的 操作 , 当 以 链表 存储 串 值 时 , 除 头 指 针 外 还 可 附设 一 个 尾 指针 ,指示 链 
表 中 的 最 后 一 个 结 点 ,并 给 出 当前 串 的 长 度 。 这 样 定 义 的 串 存储 结构 称 为 块 链 结构 ,其 定义 
如 下 : 

# define CHUNKSIZE < 用 户 定义 的 结 点 大 小 > 


typedef struct CHUNK 
{ 


char ch[ CHUNKSIZE]; 
Struct CHUNK *x next; 

}chunk; 

typedef struct 

! chunk * head, * tail; 

int length; 

}; 

由 于 在 一 般 情况 下 ,对 串 进 行 操作 时 ,只 需 从 头 向 尾 顺序 扫描 即 可 ,所 以 对 串 值 不 必 建 
立 双 向 链表 。 设 尾 指 针 的 目的 是 便于 进行 连接 操作 ,但 应 注意 连接 时 需 处 理 第 一 个 串 尾 的 
无 效 字符 。 

从 块 链 存 储 方式 的 结构 可 以 看 出 , 当 结 点 大 小 为 1 时 ,由 于 每 个 结 点 都 有 一 个 指针 域 ， 
因此 实际 上 存储 空间 只 利用 了 一 半 ( 每 两 个 存储 单位 中 有 一 个 被 实际 利用 ) 。 如 果 结 点 大 小 
为 4, 则 变 成 每 5 个 存储 单位 有 4 个 被 实际 利用 ,因此 利用 率 为 80%。 可 见 , 结 点 大 小 的 选 
择 和 存储 方式 的 选择 同样 重要 , 它 直接 影响 着 串 处 理 的 效率 。 在 各 种 串 的 处 理 系统 中 ,所 处 
理 的 串 往 往 很 长 或 很 多 。 上 面 讨论 的 存储 单元 利用 率 定义 为 存储 密度 : 

记 产 _ 串 值 所 占 的 存储 位 
存储 密度 一 亦 际 分 配 的 存储 位 

显然 ,存储 密度 小 (如 结 点 大 小 为 1 时 ) ,运算 处 理 方便 ,但 是 占用 存储 量 大 。 如 果 在 串 
处 理 过 程 中 需 进 行内 外 存 交换 , 则 会 因为 内 外 存 交换 操作 过 多 而 影响 处 理 的 总 效率 。 应 该 
看 到 , 串 的 字符 集 的 大 小 也 是 一 个 重要 因素 。 一 般 地 ,字符 集 小 , 则 字符 的 机 内 编码 就 短 ,这 
也 影响 了 串 值 的 存储 方式 的 选取 。 如 果 存 储 密度 大 , 则 在 串 处 理 过 程 中 进行 内 外 存 交 换 比 
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较 少 ,但 是 操作 起 来 比 结 点 大 小 为 1 时 困难 得 多 。 例 如 ,要 删除 图 4. 12 中 的 字符 'B' , 若 结 
点 大 小 为 1, 则 是 一 个 简单 的 单 链表 的 删除 ; 若 结 点 大 小 为 4, 则 在 删除 'B' 后 还 必须 将 后 面 
结 点 中 的 字符 全 部 向 前 移动 ,如 图 4. 13 所 示 。 


Als|lclp| 才 -srlclal 才 -Ts se] 


(a) 删除 前 


Alc|p|s| 才 -slclalrly^ 


(b) 删除 后 
图 4.13 删除 串 中 的 字符 


显然 , 当 用 块 链 结 构 存 储 串 值 时 ,虽然 链表 结构 比较 灵活 , 串 长 不 受 限制 ,但 同样 受到 存 
储 密度 的 制约 ,存在 着 结 点 大 小 取 多 大 较 合 适 的 问题 ,从 而 使 串 的 操作 复杂 化 。 

2) 堆 存 储 结构 

由 于 顺序 存储 结构 和 链 式 存储 结构 在 使 用 中 各 有 其 不 足 之 处 ,因此 ,在 很 多 实际 应 用 的 
串 处 理 系 统 中 ,采用 了 另 一 种 动态 存储 结构 。 它 的 特点 是 : 每 个 串 的 串 值 各 自 存储 在 一 组 
地 址 连续 的 存储 单元 中 ,但 它们 的 存储 地 址 是 在 程序 执行 过 程 中 动态 分 配 而 得 到 的 。 系 统 
中 将 一 个 容量 很 大 .地 址 连续 的 存储 空间 作为 串 值 的 可 利用 空间 ,每 当 建立 一 个 新 串 时 , 系 
统 就 从 这 个 可 利用 空间 中 分 配 一 个 大 小 和 串 长 相等 的 空间 ,用 于 存储 新 串 的 串 值 。 假 设 以 
一 维 数组 


char store[maxsize]; 


表示 可 供 串 值 进 行动 态 分 配 的 存储 空间 , 其 中 
maxsize 表示 连续 空间 的 最 大 容量 ,并 设 整 型 变量 
free 指示 该 存储 空间 中 尚未 进行 分 配 区 间 的 起 始 
地 址 , 则 在 程序 执行 过 程 中 ,每 当 产生 一 个 串 时 ， | 

均 可 从 这 个 起 始 地 址 起 ,为 串 值 分 配 一 个 存储 空 Tn 
间 ( 除 非 尚未 分 配 空间 大 小 不 足 串 长 ) ,同时 建立 fiee | 

一 个 串 的 描述 符 指示 串 的 长 度 及 其 在 数组 store 未 分 配 的 存储 空间 

中 的 起 始 位 置 。 例 如 在 图 4. 14 中 ,s 为 已 建立 串 
值 的 串 ,free 为 指示 当前 可 分 配 空间 起 始 地 址 的 maxsize 
指针 ,其 初 值 为 1。 称 这 种 存储 结构 为 堆 结构 ,其 图 4.14 串 的 堆 结构 示意 图 
说 明 如 下 : 


118.| T= 


length stadr 


store 


typedef struct strtp 
{ 
int curlen, * stadr; 


}; 


其 中 ,curlen 域 指示 串 序 列 的 长 度 ,stadr 域 指示 串 序列 在 store 中 的 起 始 地 址 。 借 助 这 两 个 
域 可 在 这 种 存储 结构 的 串 名 和 串 值 之 间 建 立 起 一 个 对 应 关系 , 称 作 串 名 的 存储 映像 (或 描述 
符 )。 存 储 映像 可 有 其 他 形式 ,例如 以 链表 存储 串 值 时 定义 的 串 类 型 也 是 一 种 存储 映像 , 它 
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以 头 指 针 指 示 串 值 序列 的 第 一 个 字符 ,以 尾 指针 和 串 长 指示 串 值 序列 的 最 后 一 个 字符 。 总 
之 ,无 论 设 定 什么 形式 都 必须 保证 为 访问 串 值 提供 足够 的 信息 。 所 有 串 名 的 存储 映像 构成 
了 一 张 为 系统 中 所 有 串 名 和 串 值 之 间 建 立 一 一 对 应 关系 的 符号 表 。 例 如 图 4. 15 所 示 为 以 
顺序 表 表 示 的 符号 表 , 表 中 每 个 元 素 都 是 一 个 串 的 描述 符 ,表示 一 个 串 。 在 C 语言 中 ,存在 
一 个 称 为 堆 的 自由 空间 ,由 动态 分 配 函 数 malloc() 分 配 一 块 实际 串 长 所 需 的 存储 空间 ,如 
果 分 配 成 功 , 则 返回 这 段 空间 的 起 始 地 址 ,作为 串 的 基 址 。 由 free() 释 放 串 不 再 需要 的 


空间 。 


符号 表 stridx[maxsize] 串 值 存 储 空间 store[maxsize] 
al3|1 B|E|I J| IINIclsla 
b|5|4 AlN|lGlHulAll 
e1019 
d|8|。9 


free=17 


length stadr 
图 4.15 串 的 存储 映像 示例 


4.2.3 字符 串 基本 操作 的 实现 


实际 应 用 中 有 很 多 串 的 操作 。 例 如 在 用 Word 进行 文字 编辑 的 时 候 , 若 要 选择 文档 中 
的 一 部 分 字符 进行 复制 ,就 涉及 “ 求 子 串 ” 的 操作 ; 若 要 使 用 “查找 ”功能 则 涉及 串 的 “ 求 子 串 
定位 操作 (匹配 模式 )”。 虽 然 从 逻辑 结构 来 看 , 串 是 特殊 的 线性 表 , 但 是 ,从 前 面 的 讨论 中 可 
见 , 串 的 存储 结构 和 线性 表 不 同 , 串 的 基本 操作 和 线性 表 也 不 同 : 一 是 它们 的 基本 操作 子 集 
不 同 ; 二 是 线性 表 的 操作 通常 以 "数据 元 素 ” 为 操作 对 象 ,而 串 的 操作 主要 以 * 串 的 整体 ”为 
操作 对 象 。 例 如 ,对 线性 表 的 查找 操作 通常 是 在 表 中 查找 一 个 关键 字 等 于 给 定 值 的 元 素 ,而 
对 串 的 查找 操作 则 是 查找 一 个 串 。 因 此 ,实现 串 的 基本 操作 有 它 自 己 的 处 理 方法 。 串 的 基 
本 运算 有 赋值 、 连 接 、 求 串 长 . 求 子 串 、 求 子 串 在 主 串 中 出 现 的 位 置 , 判 断 两 个 串 是 否 相等 、 删 
除 子 串 等 。 本 节 针 对 4. 2. 2 节 中 定义 的 string 类 型 的 串 ,着 重 讨论 用 静态 存储 方式 存储 的 
串 的 操作 。 下 面 的 算法 示例 尽 可 能 以 C 语言 的 库 函 数 表 示 其 中 的 一 些 运算 , 若 没 有 库 函 
数 , 则 用 自 定义 函数 说 明 。 


1. 串 连接 、 求 子 串 


串 连接 操作 就 是 把 两 个 串 合 并 为 一 个 串 的 操作 。 这 个 操作 看 起 来 非常 简单 ,但 是 如 果 
串 的 存储 方式 不 一 样 ,操作 也 可 能 有 相应 的 区 别 。 如 采用 链 式 存储 时 ,只 需要 修改 两 个 串 的 
指针 即 可 。 但 是 若 采 用 静态 存储 结构 , 巾 于 事先 分 配给 串 的 空间 是 不 能 改变 的 ,所 以 如 果 两 
个 串 合并 后 长 度 有 可 能 超过 分 配 的 存储 空间 大 小 , 则 必须 做 一 些 辅助 工作 。 由 于 这 里 着 重 
讨论 用 静态 存储 方式 存储 的 串 , 串 定义 为 其 长 度 在 一 定 范 围 内 可 变 的 字符 型 数组 ,因此 访问 
串 值 可 以 直接 通过 串 名 (或 串 的 标识 符 ) 进 行 。 由 于 这 种 类 型 的 串 的 长 度 的 上 界 maxnum 
的 值 在 常量 说 明 中 已 被 确定 ,而 且 在 整个 程序 的 执行 中 不 可 改变 。 因 此 这 种 类 型 的 串 的 操 
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作 特 点 是 : 如 果 在 操作 中 出 现 串 值 序列 的 长 度 超过 上 界 maxnum 时 ,约定 用 截 尾 法 进行 处 
理 , 即 丢弃 超出 maxnum 部 分 的 字符 序列 。 

1) 串 的 连接 : Concat(1,s,t) 

假设 1,s,t 都 是 string 型 的 串 的 变量 , 且 1 为 s 连 接 t 之 后 得 到 的 串 , 则 连接 运算 是 将 s 
和 t 的 串 值 分 别传 送 到 1 的 相应 位 置 上 ,超过 maxnum 的 部 分 截断 。 其 运算 结果 可 能 有 
3 种 情况 : 

@ s. curlen 二 tcurlen 和 maxnum ,如 图 4.16(a) 所 示 , 得 到 的 1 串 是 正确 的 结果 ; 

@ s. curlen 十 t. curlen 盖 maxnum 而 s. curlen<maxnum, 则 将 t 的 一 部 分 截断 ,得 到 的 
1 串 只 包含 t 的 一 个 子 串 ,如 图 4. 16(b) 所 示 ; 

@ s. curlen 王 maxnum, 则 得 到 的 1 串 只 是 s 一 个 串 , 如 图 4. 16(Cc) 所 示 。 


S.curlen 一 1 tcurlen 一 1 
日 | t | 
! | 
1.curlen—1 maxnum—]1 下 


(a) s.curlen+tt.curlenmaxnum 


Ss.curlen—] 1 tcurlen 一 1 
S t 


1 t 中 被 截 去 的 部 分 
1.curlen-1 4 maxnum-l 
(b) s.curlentt.curlen>maxnum 而 s.curlen<maxnum 


S.curlen 一 ! tcurlen 一 ! 1 


{中 字符 被 全 部 截 去 


1.curlen—1 maxnum 一 1 
(c) s.curlen=maxnum 


图 4.16 串 的 连接 操作 CONCAT(1,s,D 示 意图 


根据 上 述 3 种 情况 可 以 得 到 算法 4. 5。 
算法 4.5 ” 串 连 接 算法 


// 返 回 s 和 + 连接 的 结果 ,s 和 + 的 值 不 变 , 当 有 串 值 超 长 时 ,用 截 尾 法 解决 
void concat(string * s, string x*t,string *1) 
{ 
int 1,j; 
if (s—-> length+ 七 一 > length< = maxnum) 
{ 
for(i=0;i<s->1ength;i++) 
1->ch[i]=s->ch[i]; 
for(j=0;j<t-> length;j++,i++) 
1->ch[i]=t->ch[j]; 
1-> length=s-> 1length+ 七 -> length; 
上 // 正 常 连接 
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else 
if((s—->length+t—>1length> maxnum) &&(s 一 > length< maxnum)) 
{ 
for(i=0;i<s 一 > length;i++) 
1->ch[i]=s->ch[i]; 
for(j= 0;i<maxnum;j++,i++) 
1->ch[i]=t->ch[j]; 
1-> length = maxnum; 
} // 只 连接 t 的 子 串 
else 
if(s 一 > length== maxnum) 
{ 
for(i= 0;i<maxnum;i+t+) 
1->ch[il]=s->ch[i]; 
1-> length = maxnum; 
}; // 串 1 只 含 串 s 
} 


2) 求 子 串 : SubStr(sub,s,start,len) 

在 后 续 的 学 习 中 , 求 子 串 将 是 经 常 碰 到 的 操作 之 一 ,不 妨 现在 就 记 住 这 个 函数 ,在 各 种 
语言 中 其 使 用 方法 基本 一 致 。 这 个 函数 将 s 串 中 从 第 start 个 字符 开始 长 度 为 len 的 字符 
序列 复制 到 sub 中 。 

算法 4.6 求 子 串 算法 。 


#define FALSE 0 
#define TRUE 1 
int SubStr(string * sub, string * s, int start, int len) 
{ 
// 车 0 二 start 二 s->1length-1 且 0 过 len 近 s.curlen- start+1, 返 回 函数 值 TRUE 
// 否 则 sub 为 非法 串 , 并 返回 函数 值 FALSE, 此 处 start 为 子 串 的 开始 下 标 , 而 不 是 位 序号 
// 下 标 = 位 序号 -1 
int i; 
if((start >= 0&&start <s—> length)&&(len>= 0&&len<= s—-> length— start)) 
{ 
for(i= 0;i< len;i++) 
sub—>ch[i]=s—->ch[start+i]; 
sub— > length= len; 
return TRUE; 
上 
else 
{ 
sub- > length= —1; // 串 长 等 于 - 1 表示 非法 串 
return FALSE; 


2. 求 子 串 位 置 : 串 的 模式 匹配 


1) 模式 匹配 的 概念 
设 有 两 个 串 S 和 了 ,如 果 了 是 S 的 子 串 , 则 将 查找 P 在 S 中 出 现 的 位 置 的 操作 过 程 称 为 
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模式 匹配 , 称 S 为 正文 (text) , 称 P 为 模式 (pattern) 。 容 易 想到 了 完全 有 可 能 在 S 中 多 次 出 
现 ,例如 : S='ABCDEABCFGABC',P='ABC' ,显然 ,P 相继 在 S 中 出 现 了 3 次 ,因此 把 P 
在 S 中 的 首次 出 现 的 地 方 作 为 子 串 P 在 串 S 中 的 位 置 。 
2) 求 子 串 位 置 的 定位 函数 (简单 模式 匹配 ) : Index(s,t) 
在 4.2.1 节 ,曾经 借助 串 的 其 他 基本 操作 给 出 了 定位 函数 的 一 个 算法 ( 见 算法 4. 4) 。 
根据 算法 4. 4 的 基本 思想 ,可 以 写 出 不 依赖 于 其 他 操作 的 匹配 算法 ,如 算法 4.7 所 示 。 
算法 4.7 串 的 模式 匹配 算法 。 
int Index bf(string * s,string *t) 
{ //Brute -Force 算 法 思想 求 模式 串 t 在 主 串 s 中 的 定位 函数 
int i=0,j=0; // 指 针 初 始 化 
while ((i<s 一 > length)&&(j<t—> length)) 
{ 
if(s->ch[i]==t->ch[j]) 
{ 


i=i+1; j=j+1; 


} // 继 续 比 较 后 继 字符 
else 
{ 
i=1-j+1s 
j=0; 
} // 指 针 后 退 重新 开始 匹配 
} 
if(j> = 七 -> length) 
return ii 一 七 -> length+1; // 返 回 位 序号 
else 


return 一 1; 


} 


在 算法 4.7 中 ,利用 i 和 j 分 别 指示 正文 s 和 模式 + 中 当前 正 待 比 较 的 字符 位 置 。 算 法 
的 基本 思想 是 : 从 正文 s 的 第 一 个 字符 起 和 模式 的 第 一 字符 比较 , 若 相 等 , 则 继续 逐个 比较 


后 续 字符 ,否则 从 正文 的 第 二 个 字符 起 再 重新 与 模式 的 lie3 
字符 比较 。 以 此 类 推 ,直至 模式 t 中 的 每 个 字符 依次 和 第 二 bs aeasoan 
主 串 s 中 的 一 个 连续 的 字符 序列 相等 , 则 称 匹配 成 功 , 函 a 
数值 为 与 模式 t 中 的 每 一 个 字符 相等 的 字符 在 正文 s 中 “第 ? 趟 匹配 a babeabeacbab 
的 序号 ; 否则 匹配 不 成 功 , 函 数值 为 零 。 tj=! 本 

图 4. 17 展示 了 模式 t= 'abcac' 和 正文 s 的 匹配 第 3 趟 配 ababcabcacbab 
过 程 。 js 


算法 4.7 的 匹配 过 程 易于 理解 , 且 在 某 些 应 用 场合 ， 第 4 趟 Ft 配 ab a 
如 文本 编辑 等 ,效率 也 较 高 。 例 如 ,在 检查 模式 'STRING' 入 
是 否 存 在 于 正文 'A STRING SEARCHING EXAMPLE ! 
CONSISTING OF SIMPLE TEXT' 中 时 ,上 述 算法 中 的 i 
WHILE 循环 次 数 ( 即 进行 单个 字符 比较 的 次 数 ) 为 41， 第 6 是 上 配 ab abe 
恰好 为 (index 十 t 一 > length 一 1) 十 4。 在 这 种 情况 下 ,此 j 
算法 的 时 间 复 杂 度 为 O(n 十 m)。 其 中 和 mm 分别 为 正 。 图 4.17 算法 4.7 的 匹配 过 程 
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文 和 模式 的 长 度 。 然 而 ,在 有 些 情况 下 ,该 算法 的 效率 却 很 低 。 例 如 , 当 模 式 串 为 '00000001'， 
而 正文 串 为 '000000000000000000000000001' 时 ,由 于 模式 中 的 前 7 个 字符 均 为 '0' ,而 正文 
串 中 前 26 个 字符 均 为 '0', 每 趟 比较 都 在 模式 的 最 后 一 个 字符 出 现 不 等 ,此 时 需 将 指针 i 回 
溯 到 i 一 6 的 位 置 上 ,并 从 模式 的 第 一 个 字符 开始 重新 比较 ,整个 匹配 过 程 中 指针 i 需 回溯 
45 次 , 则 WHILE 循环 次 数 为 46 * 8(index * m)。 可 见 , 该 算法 在 最 坏 情况 下 的 时 间 复 杂 
度 为 O(n * m)。 这 种 情况 是 由 于 0、1 两 种 字符 的 文本 串 处 理 中 经 常 出 现 ,在 正文 串 中 可 能 
存在 多 个 和 模式 串 “ 部 分 匹配 ”的 子 串 , 因 而 引起 指针 i 的 多 次 回溯 所 致 。01 串 可 能 出 现在 
许多 应 用 中 ,例如 ,一 些 计算 机 的 图 形 显示 就 是 把 画面 表示 为 一 个 01 串 ,一 页 书 就 是 由 几 百 
万 个 0 和 1 组 成 的 串 ,一 个 字符 的 ASCII 码 也 可 以 看 成 八 个 二 进位 的 01 串 ,包括 汉字 存储 
在 计算 机 中 也 是 作为 一 个 01 串 看 待 。 在 二 进位 计算 机 上 实际 处 理 的 都 是 01 串 。 

若 对 简单 模式 匹配 算法 加 以 改进 : 每 趟 匹配 过 程 中 若 出 现 字符 不 等 时 ,不 回溯 i 指针 ， 
而 是 利用 已 经 得 到 的 “部 分 匹配 ”的 结果 将 模式 向 右 “滑动 一段 距 离 后 再 继续 比较 , 则 能 将 
模式 匹配 算法 的 时 间 控 制 在 O(n 十 m) 数 量 级 上 ,这 就 是 KMP 算法 的 主要 思路 。 若 要 了 解 
具体 的 算法 ,有 兴趣 的 读者 可 以 参看 书后 所 列 的 参考 文献 。 


3. 子 串 的 插入 和 修改 、 串 的 置换 操作 


利用 连接 运算 和 求 子 串 运算 ,不 难 实现 对 串 的 插入 删除 和 修改 。 

1) 插入 操作 

令 a 二 'DATASTRUCTURE', 如 果 要 在 串 a 的 第 4 个 字符 和 第 5 个 字符 间 插入 一 个 空 
格 字 符 ' “', 可 通过 下 述 的 基本 串 运 算 来 完成 。 设 s 表示 结果 串 , 则 有 


s= Concat(SubStr(a,0,4),' ',Substr(a,4,13)) 


2) 修改 操作 
设 a='BEIHAI' ,希望 得 到 的 结果 串 是 'NANHAI', 可 通过 先 取 子 串 再 连接 得 到 


a= Concat( 'NAN', SubStr(a, 3,3)); 


3) 置换 操作 
置换 操作 是 把 串 中 的 子 串 用 另 一 个 串 来 代替 。 
实现 置换 Replace(a,b,c) 的 算法 是 : 在 a 串 中 搜寻 和 bb 串 相同 的 子 串 的 位 置 , 若 有 , 则 
以 < 串 取 代 这 个 子 串 ,然后 ,再 继续 搜索 ,直到 在 a 中 找 不 到 和 b 相同 的 子 串 为 止 。 
运用 上 述 串 的 基本 运算 ,可 以 进行 各 种 字符 信息 处 理 的 工作 。 下 面 是 一 个 简单 的 应 用 
示例 。 
设 有 一 篇 用 英文 书写 的 文章 ,要 求 统计 每 个 英文 字母 在 文章 中 出 现 的 频率 。 具 体 实 现 
时 ,把 文章 看 作 一 个 串 ,用 text 表示 , 则 可 利用 串 的 基本 运算 写 出 统计 每 个 字母 出 现 频率 的 
算法 ,如 算法 4. 8 所 示 。 
算法 4.8 统计 各 字母 频率 算法 。 
void Letter Frequency(string * text) 
{ ”// 统 计 给 定 文本 text 中 每 个 字母 出 现 的 频率 
char alph[ ] = {"abcdefghijklmnopqrstuvwxyz"}; 
float freq[26] = {0}; 
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} 


int total = 0; 

int n, i; 

n= len(text); 
string c; 
for(i=0;i<n;it+) 


' 


} 


SubStr( &c, text, i,1); 
if(Index(alph, c)> 0) 
{ 

total+t+; 

alph[ (int)(c.ch[0] — 'a')]++; 
} 


for(i=0;i<26;i+t+) 


{ 


freq[i] =alph[i]/total; 
if(freq[i]!= 0) 
printf("%c: %f\n", (char)(i+ (int)'a'), freq[i]); 


4.2.4 字符 串 的 应 用 举例 


文本 编辑 是 串 的 一 个 很 典型 的 应 用 。 它 被 广泛 用 于 各 种 源 程序 的 输入 和 修改 ,也 被 应 
用 于 信函 、 报 刊 . 公 文 .书籍 的 输入 、 修 改 和 排版 。 文 本 编辑 的 实质 就 是 修改 字符 数据 的 形式 
或 格式 。 在 各 种 文本 编辑 程序 中 ,把 用 户 输入 的 所 有 文本 都 作为 一 个 字符 串 。 尽 管 各 种 文 
本 编辑 程序 的 功能 有 强 有 弱 , 但 是 其 基本 的 操作 都 是 一 致 的 ,一 般 包括 串 的 输入 、 查 找 、 修 
改 、 删 除 ,输出 等 。 

作为 串 运 算 的 应 用 举例 ,下 面 对 文 本 编辑 进行 简单 介绍 。 

在 用 计算 机 求解 问题 时 ,首先 要 编写 程序 ,然后 上 机 调试 程序 和 运行 程序 ,以 获得 结果 。 
在 调试 和 运行 中 , 当 发 现 程序 不 够 理想 或 有 错误 时 , 则 需 进行 修改 。 当 然 ,修改 工作 可 以 手 
工 进行 ,但 很 麻烦 ,而 且 使 调试 时 间 拖 得 很 长 。 若 利用 计算 机 系统 提供 的 文本 编辑 程序 , 则 
可 以 方便 地 完成 各 种 修改 工作 。 例 如 ,如 下 程序 : 


100 
101 
102 
103 
104 
105 
106 
107 


void main() 

{int a,b,s; 

scanf("%f, %f",g&a,g&b); 
s=a; 

if(s<b) s=b; 

S=SxXxS7 

printf("s= %f£",s); 

} 


将 这 个 程序 看 作 一 个 文本 ,编写 程序 就 是 进行 文本 编辑 。 文 本 编辑 程序 要 求 把 文章 划 
分 为 若干 行 , 每 行 可 以 有 一 个 或 几 个 语句 ,如 图 4. 18 所 示 ,图 中 + 为 换行 符号 。 在 输入 程序 
的 同时 ,文本 编辑 程序 先 为 文本 串 建立 相应 的 页 表 和 行 表 , 即 建立 各 子 串 的 存储 映像 。 串 值 
存放 在 文本 工作 区 ,而 将 页 号 和 该 页 中 的 起 始 行 号 存放 在 页 表 中 ; 行 号 . 串 值 的 存储 起 始 地 
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址 和 串 的 长 度 记录 在 行 表 , 由 于 使 用 了 行 表 和 页 表 , 因 此 新 的 一 页 或 一 行 可 存放 在 文本 工作 区 


的 任何 一 个 自由 区 中 ,页 表 中 的 页 号 和 行 表 中 的 行 号 是 按 递增 的 顺序 排列 的 ,如 图 4. 19 所 示 。 
行 号 “| 起 始 地 址 | ”长 度 
100 201 12 
201 101 213 12 
vilol|lild mlali n|(|)| + |: i Talt 102 225 21 
a b s ;| 4 |s |a n| 全 | %| 103 246 5 
%|f| 有 |a &|b|l)|; [| :is rg 104 251 12 
+ 上 rs|<el)ls|=le|l;: | os|= 105 263 7 
s|*|s| :| plrlilnltrlcl ls|=|% 106 270 17 
S +1}|! [| | 107 287 2 
图 4.18 文本 示例 图 4.19 行 表示 例 
下 面 讨论 文本 编辑 的 过 程 。 


首先 ,输入 文本 ,与 此 同时 ,编辑 程序 将 建立 行 表 , 假 设 此 例 的 行 号 自 100 开始 ,每 当 给 
出 一 个 行 号 ,编辑 程序 就 先 检查 行 表 。 若 给 出 的 行 号 在 行 表 中 , 则 需要 进行 的 处 理 为 删除 或 
修改 ; 若 给 出 的 行 号 不 在 行 表 中 , 则 为 插入 一 个 新 行 。 

插入 一 行 时 ,一 方面 ,需要 在 文本 末尾 的 空闲 工作 区 写 入 该 行 的 串 值 ; 另 一 方面 ,需要 
在 行 表 中 建立 该 行 的 信息 。 为 了 维持 行 号 的 由 小 到 大 的 顺序 ,保证 能 迅速 地 查找 行 号 ,可 能 
要 移动 行 表 中 原 有 的 一 些 行 号 ,以 便 插 入 新 行 号。 例如 ,插入 行 号 为 125, 则 行 表 从 125 开 
始 的 行 号 全 部 往 下 移动 。 

删除 一 行 时 ,只 要 在 行 表 中 删除 这 个 行 号 ,就 等 于 从 文本 中 抹 去 这 一 行 ,因为 对 文本 的 
访问 是 通过 行 表 实现 的 。 例 如 要 删除 第 140 行 , 则 行 表 中 从 140 起 的 行 号 全 应 往 上 移动 ,以 
材 盖 掉 行 号 140 及 其 相应 的 信息 。 

更 改 文本 时 ,应 指明 更 改 哪 一 行 和 哪些 字符 。 编 辑 程序 通过 行 表 查 到 更 改行 的 起 始 地 
址 ,从 而 在 文本 里 搜索 到 待 修改 的 字符 ( 串 ) 的 位 置 ,然后 进行 修改 。 一 般 有 3 种 情况 : 

(1) 新 的 字符 个 数 比 原 有 的 少 , 这 时 需要 更 改行 表 中 的 长 度 信息 和 文本 中 的 字符 ; 

(2) 新 的 字符 个 数 和 原 有 的 相等 ,这 时 只 需要 修改 文本 中 的 字符 即 可 ; 

(3) 新 的 字符 个 数 比 原 有 的 多 ,这 时 ,应 检查 本 行 与 下 一 行 之 间 是否 有 足够 大 的 空闲 空 
间 , 若 有 , 则 只 需要 修改 行 表 中 的 长 度 信息 和 文本 中 的 字符 ; 若 无 , 则 需要 另外 分 配 空间 ,并 
更 改行 表 中 的 起 始 地 址 和 长 度 信息 。 

文本 输出 时 ,其 格式 应 力求 易 读 、 美 观 大 方 。 

关于 文本 编辑 程序 的 各 命令 之 具体 算法 ,作为 串 运 算 的 练习 , 留 给 读者 自己 去 完成 。 


人 3 C++ 中 的 数组 和 字符 串 


4.3.1 C+t+ 中 的 数组 
如 前 所 述 ,数组 是 非常 有 用 的 数据 结构 ,几乎 所 有 的 高 级 程序 设计 语言 都 提供 了 数组 类 
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™ 


型 。 和 矩阵 是 科学 计算 常用 的 数据 结构 ,而 稀 朴 矩阵 又 有 其 存储 表示 和 实现 的 特殊 性 ,本 节 利 
用 C++ 的 数组 ,实现 稀 玻 矩阵 的 存储 及 其 转 置 操作 。 
例 4.1 稀疏 矩阵 类 。 


template <class T> 
class SparseMatrix 
{ 
public: 
SparseMatrix( int maxRowSize int maxColSize){}; 
~SparseMatrix(){}; 
virtual void Add(const SparseMatrix <T> &B, SparseMatrix <T> &C) const; 
virtual void Mul(const SparseMatrix <T> &B, SparseMatrix <T> &C) const; 
virtual void Transpose( SparseMatrix <T> &B)const; 
private: 
int maxRows, maxCols; 
}; 


例 4.2 行 三 元 组 表示 的 稀 朴 矩阵 的 C++ 类。 


template < class T> 
class SeqTriple 
| 
public: 
SeqTriple( int mSize); 
一 SeqTriple(){ delete [] trip; }; 
void Add(const SeqTriple<T> &B,SeqTriple<T> &C) const; 
void Mul(const SeqTriple <T> g&B,SeqTriple <T> &C) const; 
void Transpose( SeqTriple < T> g&B)const; 
friend istream &operator >>(istream &input, const SeqTriple <T> &); 
friend ostream &operator <<(ostream &output, const SeqTriple <T> &); 


private: 
int maxSize; // 最 大 元 素 个 数 
int m,n, t; // 稀 玖 矩阵 的 行 数 、 列 数 和 非 零 元 素 个 数 
Term<T> * trip; // 动 态 一 维 数组 的 指针 


}; 
例 4.3 稀 踊 矩阵 的 快速 转 置 。 


template < class T> 
void SeqTriple <T>::Transpose(SeqTriple <T> & B)const 


{ // 将 this 转 置 赋 给 B 
int xnum= new int[n]; int *k=new int[n]; // 为 num 和 kk 分 配 空间 
Bn=n B.n=n; B.t=t; 
if (t>0){ 
for (int i=0; i<n; i++) num[i] = 0; // 初 始 化 num 
for (i=0; i<t; i++) num[trip[i].col]++; // 计 算 num 
k[0]= 0; 
for(i=1; i<n; i++) k[i] =k[i-1]+num[i-1]; // 计 算 k 
for(i=0; i<t; it++) { // 扫 描 this 对 象 的 三 元 组 表 
int j=k[trip[i].col]++; // 求 this 对 象 的 第 并 项 在 B 中 的 位 置 j 


B.trip[j].row=trip[i].col; // 将 this 对 象 的 第 i 项 转 置 到 B 的 位 置 j 
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B. trip[j]. col = trip[ i]. row; 
B. trip[j].value= trip[i]. value; 
} 
} 
delete [] num; delete [] k; 
} 


4.3.2 C++ 中 的 字符 串 


字符 串 是 许多 程序 设计 语言 已 实现 的 数据 类 型 ,C++ 语言 也 在 string. h 中 提供 了 许多 
字符 串 处 理 函 数 。 例 4. 4 给 出 了 字符 串 的 C++ 类 定义 ,但 只 给 出 了 其 中 部 分 的 成 员 函 数 , 可 
以 根据 需要 加 以 扩充 。 

例 4.4 字符 串 类 。 


# include < string.h> 
class string 
public: 
string(); 
string(const char * p); 
~string(){delete [] str;} 
int find(int i, string &p); 
private: 
int n; 
char * str; 
}; 
string: :string(const char *p) 
{ 
n= strlen(p); 
str= new char[n+1]; 
strcpy( str, p); 


回 题 4 


1. 设 有 一 个 二 维 数组 ALm][z] ,假设 AL0]Lo] 存 放 位 置 在 64406, ,AL2][2] 存 放 位 置 
在 676uw ,每 个 元 素 占 一 个 地 址 空间 , 求 AL3][3]uo 存放 在 什么 位 置 ? 

分 析 : 根据 二 维 数组 的 地 址 计算 公式 LOC(i,j) 二 LOC(0,0) 十 [mn xi 十 门 *xs， 首 先 要 
求 出 数组 第 二 维 的 长 度 , 即 姥 值 。 

2. 设 稀疏 矩阵 采用 十 字 链 表 结 构 表示 , 试 写 出 实现 两 个 稀疏 矩阵 相 加 的 算法 。 

3. 简 述 下 列 每 对 术语 的 区 别 : 空 串 和 空格 串 ; 串 变 量 和 串 常 量 ; 主 串 和 子 串 ; 串 名 和 
串 值 。 

4. 对 于 字符 串 的 每 个 基本 运算 ,讨论 是 否 可 用 其 他 基本 运算 构造 而 得 ,如何 构 造 。 

5. 设 串 sl 二 'ABCDEFG',s2 一 'PQRST', 函 数 conCx,y) 返 回 x 和 y 串 的 连接 串 ， 
subs(s,i,j) 返 回 串 s 的 从 序号 i 的 字符 开始 的 j 个 字符 组 成 的 子 串 ,len(s) 返 回 串 s 的 长 度 ， 
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则 con(subs(si ,2,len(ss)),subs(si ,len(s;) ,2))) 的 结果 串 是 什么 ? 

6. 设 s=='T AM A STUDENT',t=='GOOD',q= 二 'WORKER', 求 : Len(s),Len(t)， 
SubStr(s,8,7),SubStr(t,2,1),Index(s,'A'),Index(s,t),Replace(s, 'STUDENT',gq) 和 
Concat(substr(s,6,2),Concat(t,substr(s,7,8)))., 

7. 试问 执行 以 下 过 程 会 产生 怎样 的 输出 结果 ? 

Demonstrate( ) 

{ 

Assign(s, 'THIS IS A BOOK'); 

Replace(s, SubStr(s, 3,7), 'ESE ARE'); 

Assign(t, Concat(s, 'S')); 

Assign(u, 'XYXYXYXYXYXY'); 

Assign(v, SubStr(u, 6,3)); 

Assign(w, 'W'); 

printf('t=%sv= %su=$%s $s',t,v,u,replace(u, Vv,w)); 

} 

8. 已 知 s 一 'CXYZ) 十 * vt 一 '(X 十 Z) * Y'。 试 利用 连接 、 求 子囊 和 置换 等 运算 ,将 s 转 
化 为 t。 

9. 编写 一 个 算法 void StrReplace(char * T,charx* P,char* S) ,将 工 中 首次 出 现 的 子 
串 P 替换 为 串 S。 

注意 : S 和 了 的 长 度 不 一 定 相等 ,可 以 使 用 已 有 的 串 操作 。 

10. 车 X 和 YY 是 用 结 点 大 小 为 1 的 单 链表 表示 的 串 ,设计 一 个 算法 , 找 出 X 中 第 一 个 
不 在 Y 中 出 现 的 字符 。 

11. 在 串 的 顺序 存储 结构 上 实现 串 的 比较 运算 StrCmp(S,T) 。 

12. 若 S 和 工 是 用 结 点 大 小 为 1 的 单 链表 存储 的 两 个 串 , 试 设计 一 个 算法 找 出 S 中 第 
一 个 不 在 工 中 出 现 的 字符 。 


仁 机 练习 4 


1. 稀 玖 矩阵 运算 器 。 

基本 要 求 : 以 * 带 行 逻辑 链接 信息 ”的 三 元 组 顺序 表 表 示 稀 玻 矩阵 ,实现 两 个 矩阵 相 加 、 
相 减 和 相 乘 的 运算 。 稀 疏 矩 阵 的 输入 形式 采用 三 元 组 表示 ,而 运算 结果 的 矩阵 则 以 通常 的 
阵列 形式 列 出 。 

2. 设计 一 个 算法 将 串 中 所 有 的 字符 倒 过 来 重新 排列 。 

3. 采用 顺序 结构 存储 串 ,编写 一 个 函数 index(sl1,s2) ,用 于 判断 s2 是 否 是 sl 的 子 串 。 
若是 , 则 返回 其 在 主 串 中 的 位 置 ,否则 返回 一 1。 

提示 : 设 s 一 'aaaz…aa'ji Ss 二 'bb,…b,', 从 si 中 找 出 与 b, 匹配 的 字符 ai, 若 ai 王 bl , 则 判 
断 是 否 ati 一 bs, ai-l 一 bs, 若 都 相等 ,sz 为 Si 的 子囊 ,否则 继续 比较 a; 之 后 的 字符 。 

4. 利用 串 的 基本 运算 ,编写 一 个 算法 删除 串 s, 中 所 有 ss 子 串 。 

提示 : 本 题 利 用 index() 函 数 和 删除 子 串 函数 循环 实现 。 
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本 章 学 习 要 点 

(1) 熟悉 树 和 二 叉 树 的 递归 定义 、 有 关 的 术语 及 基本 概念 。 

(2) 熟练 掌握 二 又 树 的 性 质 , 了 解 相应 的 证 明 方法 。 

(3) 熟练 掌握 二 又 树 的 两 种 存储 方法 、 特 点 及 适用 范围 。 

(4) 遍历 二 叉 树 是 二 叉 树 的 各 种 运算 的 基础 ,因此 ,不 仅 要 熟练 掌握 各 种 次 序 的 遍历 算 
法 ,而 且 还 要 能 灵活 运用 遍历 算法 ,实现 二 叉 树 的 其 他 各 种 运算 。 

(5) 了 解 二 又 树 的 线索 化 及 其 实质 ,是 建立 结 点 及 其 在 相应 次 序 ( 先 根 . 中 根 或 后 根 ) 下 
的 前 驱 和 后 继 之 间 的 直接 联系 ,目的 是 加 速 遍历 过 程 ,迅速 查找 给 定 结 点 在 指定 次 序 下 的 前 
驱 和 后 继 。 

(6) 熟练 掌握 树 .森林 与 二 又 树 之 间 的 转换 方法 。 

(7) 了 解 最 优 二 又 树 的 特性 ,掌握 建立 最 优 二 又 树 和 哈 夫 曼 编 码 的 方法 。 

线性 结构 用 于 描述 数据 元 素 间 的 线性 关系 ,然而 实际 应 用 中 数据 元 素 之 间 的 关系 错 综 
复杂 ,很 难 完全 用 线性 关系 来 描述 。 从 本 章 开 始 将 讨论 非 线性 的 数据 结构 。 树 是 一 种 典型 
的 非 线性 的 数据 结构 , 它 描述 了 客观 世界 中 事物 之 间 的 层次 关系 ,这 种 结构 有 着 广泛 的 应 
用 ,一 切 具 有 层次 关系 的 问题 都 可 以 用 树 来 描述 。 例 如 : 家 族 的 家 谱 、 各 种 社会 机 构 的 组 织 
都 呈现 出 树 形 的 层次 结构 ; 在 操作 系统 的 文件 系统 中 ,用 树 来 表示 目录 结构 ; 在 编译 程序 
中 ,用 树 来 表示 源 程序 的 语法 结构 等 。 


61 树 的 概念 与 操作 


5.1.1 树 的 概念 
1. 树 (tree) 的 定义 


首先 ,可 以 注意 到 ,自然 界 中 的 树 有 树 根 、 树 枝 ( 不 妨 称 为 子 树 ) 和 树叶 ,由 此 可 以 给 出 以 
下 关于 树 的 定义 。 

定义 5.1 树 是 由 n(n 三 0) 个 结 点 组 成 的 有 限 集合 , 当 =0 时 称 为 空 树 ; 否则 ,在 任 一 
非 空 树 中 : 

(1) 必 有 一 个 特定 的 称 为 根 的 结 点 ; 

(2) 剩 下 的 结 点 被 分 成 m 宇 0 个 互 不 相交 的 集合 Ti ,T,,…,T, ,而 且 这 些 集合 中 的 每 
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一 个 又 都 是 树 。 树 Ti ,T: ,…,T,。 被 称 作 根 的 子 树 。 

显然 ,这 是 一 个 递归 的 定义 ,因为 它 用 树 自身 来 定义 树 。 树 的 定义 显示 了 树 的 固有 特 
性 : 树 中 的 每 一 个 结 点 都 是 该 树 中 的 某 一 棵 子 树 的 根 。 在 定义 中 ,特别 强调 子 树 的 互 不 相 
交 特 性 , 即 每 个 结 点 只 属于 一 棵 树 ( 或 子 树 ) ,只 有 一 个 双亲 。 图 5. 1(a) 表 示 只 有 一 个 结 点 的 
树 , 图 5.1(b) 是 一 般 的 树 , 有 13 个 结 点 。 树 还 可 有 其 他 的 表示 形式 ,图 5. 2 所 示 为 图 5. 1(b) 中 
树 的 各 类 表示 ,其 中 图 5. 2(a) 是 以 嵌 套 集合 的 形式 表示 的 ( 即 是 一 些 集合 的 集合 ; 对 于 其 中 
任意 两 个 集合 ,或 者 不 相交 ,或 者 一 个 包含 男 一 个 ); 图 5. 2(b) 是 以 广义 表 的 形式 表示 的 ; 
图 5. 2(c) 用 的 是 止 人 表示 法 (类 似 书 的 编目 ) 。 一 般 来 说 ,分 等 级 的 分 类 方案 都 可 用 层次 结 
构 来 表示 ,也 就 是 说 ,都 可 表示 为 一 个 树 结构 。 


层次 


(a) 只 有 一 个 结 点 的 树 (b) 一 般 的 树 
图 5.1 树 的 示例 


(a) 嵌 套 集合 的 形式 ! Ea 


《AKB<E<K.L>.F>.C<G>,D<H<M2>.1J>>> ] 
(b) 广义 表 的 形式 (9) 止 入 表示 法 
图 5.2 树 的 其 他 3 种 表示 法 


2. 树 的 基本 术语 


下 面 给 出 树 结构 中 的 一 些 基 本 术语 。 

树 包含 若干 个 结 点 以 及 若干 指向 其 子 树 的 分 支 。 

结 点 拥有 的 子 树 数 称 为 结 点 的 度 (degree) 。 例 如 在 图 5. 1(b) 中 A 的 度 为 3,C 的 度 为 
1,F 的 度 为 0。 


第 5 章 树 


度 为 0 的 结 点 称 为 叶子 (leaf) 或 终端 结 点 。 图 5.1(b) 中 的 结 点 K、L、F、G、M.、I,J 都 是 
树 的 叶子 。 度 不 为 0 的 结 点 称 为 非 终端 结 点 或 分 支 结 点 。 除 根 结 点 之 外 ,分 支 结 点 也 称 为 
内 部 结 点 。 

树 的 度 是 树 中 各 结 点 的 度 的 最 大 值 。 如 图 5. 1(b) 中 树 的 度 为 3。 结 点 的 子 树 的 根 称 为 
该 结 点 的 孩子 (child) ,相应 地 ,该 结 点 称 为 孩子 的 双亲 (parent) 。 例 如 ,在 图 5. 1(b) 所 示 的 
树 中 ,D 为 A 的 子 树 的 根 , 则 D 是 A 的 孩子 ,而 A 则 是 D 的 双亲 。 

同一 个 双亲 的 孩子 之 间 互 称 兄弟 (sibling)。 例 如 ,在 图 5. 1(b) 所 示 的 树 中 ,HI 和 丁 互 
为 兄弟 。 

将 这 些 关 系 进一步 推广 ,可 认为 DD 是 M 的 祖父 。 结 点 的 祖先 是 从 根 到 该 结 点 所 经 分 支 
上 的 所 有 结 点 ,例如 M 的 祖先 为 A.D、H。 反 之 ,以 某 结 点 为 根 的 子 树 中 的 任 一 结 点 都 称 为 
该 结 点 的 子孙 ,如 B 的 子孙 为 E、K、L 和 下 。 

结 点 的 层次 (leveD) 从 根 开 始 定义 起 , 根 为 第 1 层 , 根 的 孩子 为 第 2 层 。 若 某 结 点 在 第 C 
层 , 则 其 子 树 的 根 就 在 第 C 十 1 层 。 

其 双亲 在 同一 层 的 结 点 互 称 为 堂 兄 弟 。 例 如 , 结 点 G 与 E.F .HIJ 互 为 堂 兄 弟 。 

树 中 结 点 的 最 大 层次 称 为 树 的 深度 Cdepth) 或 高 度 。 图 5. 1(b) 所 示 的 树 的 深度 为 4。 

如 果 将 树 中 结 点 的 各 子 树 看 成 从 左 至 右 是 有 次 序 的 ( 即 不 能 互 换 ) , 则 称 该 树 为 有 序 树 ， 
否则 称 为 无 序 树 。 在 有 序 树 中 最 左边 的 子 树 的 根 称 为 第 一 个 孩子 ,最 右边 的 子 树 的 根 称 为 
最 后 一 个 孩子 。 

森林 (forest) 是 m(m 宇 0) 棵 互 不 相交 的 树 的 集合 。 对 树 中 每 个 结 点 而 言 , 其 子 树 的 集 
合 即 为 森林 。 


5.1.2 树 的 基本 操作 


树 的 基本 操作 有 下 列 几 种 。 

(1) 初始 化 操作 : INITATE(T) , 置 工 为 空 树 。 

(2) 求 根 函数 : ROOT(T) 或 ROOT(x) , 求 树 T 的 根 或 求 结 点 x 所 在 的 树 的 根 结 点 。 
若 工 是 空 或 x 不 在 任何 一 棵 树 上 , 则 函数 值 为 “ 空 。 

(3) 求 双亲 函数 : PARENT(T,x) , 求 树 T 中 结 点 x 的 双亲 结 点 , 若 结 点 x 是 树 工 的 根 
结 点 或 结 点 x 不 在 树 工 中 , 则 函数 值 为 “ 空 ”。 

(4) 求 孩子 结 点 函数 : CHILDCT,x:iD , 求 树 T 中 结 点 x 的 第 i 个 孩子 结 点 , 若 结 点 x 
是 树 T 的 叶子 或 无 第 i 个 孩子 或 结 点 x 不 在 树 工 中 , 则 函数 值 为 “ 空 ”。 

(5) 求 右 兄弟 函数 : RIGHT_SIBLING(CT,x) , 求 树 工 中 结 点 x 右边 的 兄弟 , 若 结 点 x 
是 其 双亲 的 最 右边 的 孩子 结 点 或 结 点 x 不 在 树 中 , 则 函数 值 为 * 空 ”。 

(6) 建树 函数 : CRT_TREE(Cx,F) .生成 一 棵 以 x 结 点 为 根 ,以 森林 下 为 子 树 森 林 
的 树 。 

(7) 插入 子 树 操作 : INS_CHILD(y.i,x), 置 以 结 点 x 为 根 的 树 是 结 点 y 的 第 i 棵 子 树 ， 
若 原 树 中 无 结 点 y 或 结 点 y 的 子 树 个 数 小 于 i 一 1, 则 为 空 操 作 。 

(8) 删除 子 树 操作 : DEL_CHILD(x,y) ,删除 结 点 x 的 第 i 棵 子 树 , 若 无 结 点 x 或 结 点 
x 的 子 树 个 数 小 于 i, 则 为 空 操作 。 

(9) 遍历 操作 : TRAVERSE(T) , 按 某 个 次 序 依次 访问 树 中 各 个 结 点 ,并 使 每 个 结 点 只 
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被 访问 一 次 。 
(10) 清除 结构 操作 CLEAR(T) ,将 树 工 置 为 空 树 。 


62 二 叉 树 


树 形 结构 和 自然 界 的 树 一 样 具 有 各 种 各 样 的 形态 ,这 增加 了 研究 树 形 结构 的 问题 的 
复杂 性 。 为 此 ,首先 定义 并 研究 规范 化 的 二 叉 树 ,讨论 二 叉 树 的 性 质 、 存 储 结构 和 运算 ， 
然后 给 出 二 叉 树 与 一 般 树 之 间 的 转换 规则 ,这 样 就 解决 了 树 的 存储 结构 及 其 运算 复杂 性 
的 问题 。 


5.2.1 二 叉 树 的 概念 
1. 二 叉 树 (binary tree) 的 定义 


定义 5.2 二 又 树 是 结 点 的 有 限 集合 ,这 个 集合 或 者 是 空 的 ,或 者 由 一 个 根 结 点 或 两 棵 
互 不 相交 的 称 为 左 子 树 的 和 右 子 树 的 二 叉 树 组 成 。 

这 个 递归 定义 表明 二 叉 树 或 者 为 空 ,或 者 是 由 一 个 根 结 点 加 上 两 棵 分 别称 为 左 子 树 和 
右 子 树 的 互 不 相交 的 二 叉 树 组 成 。 由 于 这 两 棵 子 树 也 是 二 叉 树 , 则 由 二 叉 树 的 定义 ,它们 也 
可 以 是 空 树 。 由 此 ,二 叉 树 可 以 有 五 种 基本 形态 ,如 图 5. 3 所 示 。 


gg 0o 宙 


(a) 空 二 叉 树 ”(b) 仅 有 根 结 点 的 二 叉 树 。 (c) 右 子 树 为 空 的 二 叉 树 


oo 世 


(d) 左 、 右 子 树 均 非 空 的 二 又 树 。 (e) 左 子 树 为 空 的 二 又 树 
图 5.3 二 叉 树 的 五 种 基本 形态 


二 叉 树 的 特点 是 ; 树 中 的 每 个 结 点 最 多 只 能 有 两 棵 子 树 , 即 树 中 任何 结 点 的 度数 不 大 
于 2; 二 又 树 的 子 树 有 左 、 布 之 分 ,而 且 , 子 树 的 左 、 右 次 序 是 重要 的 ,即使 在 只 有 一 棵 子 树 的 
情况 下 ,也 应 分 清 是 左 子 树 还 是 右 子 树 。 

前 面 引入 的 有 关 树 的 术语 也 都 适用 于 二 叉 树 。 

为 了 说 明 二 又 树 的 性 质 ,下 面 先 给 出 满 二 叉 树 和 完全 二 叉 树 的 定义 。 

定义 5.3 一 棵 深度 为 & 的 满 二 又 树 , 是 有 2* 一 1 个 结 点 的 深度 为 k 的 二 叉 树 。 

2 一 1 个 结 点 是 二 叉 树 所 具有 的 最 大 结 点 个 数 。 例 如 ,图 5. 4 所 示 为 一 棵 深度 为 4 的 
满 二 又 树 。 为 便于 访问 满 二 又 树 的 结 点 ,对 满 二 又 树 从 第 1 层 的 结 点 ( 即 根 ) 开 始 , 自 上 而 
下 ,从 左 到 右 , 按 顺序 给 结 点 编号 , 便 得 到 满 二 叉 树 的 一 个 顺序 表 。 

定义 5.4 一 棵 具有 个 结 点 ,深度 为 k 的 二 叉 树 , 当 且 仅 当 其 所 有 结 点 对 应 于 深度 为 
& 的 满 二 又 树 中 编号 由 1 一 7 的 那些 结 点 时 ,该 二 叉 树 便 是 完全 二 又 树 。 
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车 用 一 个 一 维 数组 tree 来 表示 完全 二 叉 树 , 则 其 编号 为 i 的 结 点 对 应 于 数组 元 素 tree[i]。 
图 5. 5 所 示 为 一 棵 完全 二 叉 树 。 


2. 二 叉 树 的 基本 操作 


与 树 的 基本 操作 相 类 似 ,二 叉 树 有 如 下 一 些 基 本 操作 。 

(1) 初始 化 操作 : INITATE(BT) , 置 BT 为 空 树 。 

(2) 求 根 函数 : ROOT(BT) 或 ROOT(x) , 求 二 又 树 BT 的 根 结 点 或 求 结 点 x 所 在 二 又 
树 的 根 结 点 , 若 BT 是 空 树 或 x 不 在 任何 二 叉 树 上 , 则 函数 值 为 * 空 ”。 

(3) 求 双亲 函数 : PARENT(BT,x), 求 二 叉 树 BT 中 结 点 x 的 双亲 结 点 , 若 结 点 x 是 二 
叉 树 BT 的 根 结 点 或 二 叉 树 BT 中 无 x 结 点 , 则 函数 值 为 “ 空 ”。 

(4) 求 孩子 结 点 函数 : LCHILD(BT,x) 和 RCHILD(BT,x) ,分别 求 二 叉 树 BT 中 结 点 
x 的 左 孩 子 和 右 孩 子 结 点 , 若 结 点 x 为 叶子 结 点 或 不 在 二 叉 树 BT 中 , 则 函数 值 为 * 空 ”。 

(5) 求 兄弟 函数 ; LSIBLING(BT,x) 和 RSIBLING(BT,x) ,分 别 求 二 又 树 BT 中 结 点 x 
的 左 兄 弟 和 右 兄 弟 结 点 ; 车 结 点 x 是 根 结 点 ,或 不 在 BT 中 ,或 是 其 双亲 的 左 / 右 子 树 根 , 则 
函数 值 为 * 空 ”。 

(6) 建树 操作 : CRT_BT(x,LBT,RBT), 生 成 一 棵 以 结 点 x 为 根 ,以 二 叉 树 LBT 和 
RBT 为 左右 子 树 的 二 叉 树 。 

(7) 插入 子 树 操作 : INS_LCHILD(BT,y,x) 和 INS_RCHILD(BT,y,x), 将 以 结 点 x 
为 根 且 右 子 树 为 空 的 二 叉 树 分 别 置 为 二 叉 树 BT 中 结 点 y 的 左 子 树 和 右 子 树 , 若 结 点 y 有 
左 子 树 / 右 子 树 , 则 插入 后 y 的 左 子 树 / 右 子 树 成 为 结 点 x 的 左 子 树 / 右 子 树 。 

(8) 删除 子 树 操作 : DEL_LCHILD(BT.x) 和 DEL_RCHILD(BT,x) ,分 别 删除 二 又 树 
BT 中 以 结 点 x 为 根 的 左 子 树 或 右 子 树 , 若 x 无 左 子 树 或 右 子 树 , 则 为 空 操作 。 

(9) 遍历 操作 : TRAVERSE(BT) , 按 某 个 次 序 依 次 访问 二 叉 树 中 各 个 结 点 ,并 使 每 个 
结 点 只 被 访问 一 次 。 

(10) 清除 结构 操作 : CLEAR(BT) ,将 二 叉 树 BT 置 为 空 树 。 

在 已 知 二 叉 树 的 逻辑 结构 和 运算 后 就 可 以 定义 二 叉 树 的 抽象 数据 类 型 。ADT5. 1 是 二 
叉 树 的 抽象 数据 类 型 描述 ,其 中 只 包含 最 常见 的 二 叉 树 运算 。 

ADT5.1 二 叉 树 ADT 

ADT BTreel( 

数据 对 象 : 


139 


MA 


140 


A 


算法 与 数据 结构 (第 三 版 ) 


二 {ai|a; 元 素 集合 ,i 二 1,2,… ,n,n 之 0} 

数据 关系 R: 

车 吃 = 名 , 则 R= 名, 称 BTree 为 空 二 叉 树 。 

车 DD 名, 则 RR= 二 {也},H 是 如 下 二 元 关系 。 

(1) 在 D 中 存在 唯一 的 称 为 根 的 数据 元 素 root, 它 在 关系 五 下 无 前 驱 。 

(2) 车 DD 一 {root} 关 $$, 则 存在 D 一 {root}=={D,,D,}, 且 DD,NMD,=$。 

(3) 若 D, 考 $, 则 D, 中 存在 唯一 的 元 素 x,,(root,z1)E 昌 , 且 存 在 D, 上 的 关系 H,CC 


互 ; 车 DD, 云 $9, 则 DD, 中 存在 唯一 的 元 素 x,, (root,x,)E 昌 ,有 上 且 存在 D, 上 的 关系 H,CH:; 
H={(root,x,), (root,x,), H,,H,}., 


(4)(D,,{H,)) 是 一 棵 符合 本 定义 的 二 叉 树 , 称 为 根 的 左 子 树 。(D,.,{ 互 ,六 是 一 棵 符 


合 本 定义 的 二 叉 树 , 称 为 根 的 右 子 树 。 


基本 操作 : 

creat() : 创建 一 个 空 二 又 树 。 

destroy() : 撤销 一 个 二 又 树 。 

isempty(): 若 二 又 树 空 , 则 返回 1; 否则 返回 0。 

clear() : 移 去 所 有 结 点 ,成 为 空 二 叉 树 。 

root(x) : 若 二 叉 树 非 空 , 则 x 为 根 的 值 , 并 返回 1 ,否则 返回 0。 
maketree(x,left,right) : 构造 一 棵 二 叉 树 , 根 的 值 为 x, 以 left 和 right 为 左右 子 树 。 
breaktree(x,left,right) : 拆 分 二 叉 树 为 三 部 分 ,x 为 根 的 值 ,以 left 和 right 分 别 为 原 


树 的 左右 子 树 。 


preorder(visit) : 使 用 函数 visitO 〇 访问 结 点 , 先 根 遍历 二 叉 树 。 
inorder(visit) : 使 用 函数 visitO 〇 访问 结 点 ,中 根 遍 历 二 叉 树 。 
postorder(visit) : 使 用 函数 visit 〇 访问 结 点 ,后 根 遍历 二 叉 树 。 
}ADT BTree 


5.2.2 二 又 树 的 性 质 


二 又 树 具 有 下 列 重 要 性 质 。 

性 质 5.1 在 二 又 树 的 第 ; 层 上 至 多 有 2 一 个 结 点 (i 宇 1)。 

利用 归纳 法 容易 证 得 此 性 质 。 

当 ;i 一 1 时 ,只 有 一 个 根 结 点 。 显 然 ,2 一 一 2 一 1 是 对 的 。 

现 假设 对 所 有 的 ,1<7 过 i ,命题 成 立 , 即 第 ) 层 上 至 多 有 2 个 结 点 。 那 么 可 以 证 明 


j 二 i 时 命题 成 立 。 


由 此 归纳 假设 : 第 i 一 1 层 上 至 多 有 2 “个 结 点 。 由 于 二 叉 树 的 每 个 结 点 的 度 至 多 为 


2, 故 在 第 i 层 上 的 最 大 结 点 数 为 第 ;一 1 层 上 的 最 大 结 点 数 的 2 倍 , 即 2*2 “一 2 。 


性 质 5.2 ”深度 为 &(& 三 1) 的 二 又 树 至 多 有 2 一 1 个 结 点 。 
由 性 质 5. 1 可 见 ,深度 为 的 二 又 树 的 最 大 结 点 数 为 


2 (第 i 层 上 的 最 大 结 点 数 ) = 212 一 2* 一 1 


第 5 章 树 


性 质 5.3 对 任何 一 棵 二 又 树 ,如 果 其 终端 结 点 数 为 no , 度 为 2 的 结 点 数 为 ns, 则 
no 二 ns 十 1]。 
设 n 为 二 又 树 工 中 度 为 1 的 结 点 数 。 因 为 二 叉 树 中 所 有 结 点 的 度 均 小 于 或 等 于 2, 所 
以 其 结 点 总 数 为 
到 一 71o 十 mi 十 ?zz (5. 1) 
再 看 二 又 树 中 的 分 支 数 。 除 根 结 点 外 ,其 余 结 点 都 有 一 个 分 支 进入 , 设 B 为 分 支 数 , 则 
nn 三 B 十 1。 由 于 这 些 分 支 是 由 度 为 1 或 2 的 结 点 引出 的 ,所 以 又 有 B= 二 ni 十 2n,。 于 是 得 
n= 二 m1 十 2ns 十 1 (S52) 


由 式 (5. 1) 和 式 (5.2) 可 得 
no 二 ns 十 1 
性 质 5.4 具有 ?7 个 结 点 的 完全 二 叉 树 的 深度 为 Llog:z | 十 1。 
证 明 : 假设 深度 为 &, 则 根据 性 质 5. 2 和 完全 二 叉 树 的 定义 有 
2"1—1<n<2—1 
或 
2 
EE 过 
k—l1<lbn 一 人 
因为 k 是 整数 ,所 以 
k=|lbn | 十 1 

性 质 5.5 ”如果 对 一 棵 有 个 结 点 的 完全 二 叉 树 (其 深度 为 | lbn | 十 1) 的 结 点 按 层 序号 
编号 (从 第 1 层 到 [1bn | 十 1 层 , 每 层 从 左 到 右 ), 则 对 任 一 结 点 i(1 三 i 过 n), 有 

(1) 如 果 i 二 1, 则 结 点 i 是 二 叉 树 的 根 ,无 双亲 ; 如 果 ;1, 则 双亲 是 结 点 i/2。 

(2) 如 果 2i nn, 则 结 点 i 无 左 孩 子 ( 结 点 i 为 叶子 结 点 ); 否则 其 左 孩 子 是 结 点 2i。 

(3) 如 果 2i 十 1 之 n, 则 结 点 i 无 右 孩 子 ; 否则 其 右 孩 子 是 结 点 2i 十 1。 

只 要 先 证 明 (2) 和 (3), 便 可 从 (2) 和 (3) 导 出 (1)。 

对 于 i 二 1, 由 完全 二 叉 树 的 定义 ,其 左 孩 子 是 结 点 2, 若 2n, 即 不 存在 结 点 ,此 时 , 结 
点 i 无 左 孩 子 。 结 点 1 的 右 孩 子 也 只 能 是 结 点 3, 车 结 点 3 不 存在 , 即 3 过 ,此 时 , 结 点 ;无 
右 孩 子 。 

对 于 ;二 1, 可 分 两 种 情况 讨论 。 

(1) 设 第 j(1<5 入 Libz |) 层 的 第 一 个 结 点 的 编号 为 i( 由 二 叉 树 的 定义 和 性 质 5. 2 可 
知 z 一 2 '), 则 左 孩 子 必 为 第 j 十 1 层 的 第 一 个 结 点 ,其 编号 为 2 二 2(2 站 1 ) 二 2i, 若 21 二 2， 
则 无 左 孩 子 ; 其 右 孩 子 必 为 第 j 十 1 层 的 第 二 个 结 点 ,其 编号 为 2i 十 1, 车 2 十 1 之 2, 则 无 右 
孩子 。 

(2) 假设 第 j(1<j 三 | 1bn | ) 层 上 某 个 结 点 的 编号 为 i(277! 二 i 过 2’ 一 1), 且 2i 十 1<n, 则 
左 孩 子 为 2i, 右 孩子 为 2i 十 1。 又 编号 为 i 十 1 的 结 点 是 编号 为 i 的 结 点 的 右 兄 弟 或 者 堂 兄弟 ， 
车 它 有 左 孩 子 , 则 编号 必 为 2i 十 2 二 2(i 十 1) , 若 它 有 右 孩 子 , 则 编号 必 为 2i 十 3 二 2(i 十 1) 十 1。 

图 5. 6 所 示 为 完全 二 叉 树 中 结 点 及 其 左 、 右 孩子 结 点 间 的 关系 。 


(a) 结 点 i 和 和 it1 在 同一 层 上 (b) 结 点 ;和 i 计 1 不 在 同一 层 上 
图 5.6 完全 二 叉 树 中 结 点 及 其 左 、 右 孩子 结 点 间 的 关系 


5.2.3 ”二叉树 的 存储 结构 及 其 实现 


1. 顺序 存储 结构 


用 一 组 连续 的 存储 单元 存储 二 叉 树 的 数据 元 素 , 将 二 叉 树 中 编号 为 i 的 结 点 的 数据 元 
素 存放 在 分 量 tree[i 一 1] 中 ,如 图 5.7 所 示 。 对 于 图 5. 5 中 的 完全 二 叉 树 ,可 以 用 向 量 (一 
维 数组 )tree[0..11] 作 为 它 的 相应 存储 结构 ; 对 于 如 图 5. 8 所 示 的 一 般 二 叉 树 ,其 顺序 存储 
结构 如 图 5.9 所 示 。 


1|2|3|4|5|6|7|8|195|11|11|112 


图 5.7 完全 二 又 树 的 顺序 存储 结构 


1|2|3|4|15|01010|101617 


图 5.9 一 般 二 又 树 的 顺序 存储 结构 


根据 完全 二 又 树 的 特性 , 结 点 在 向 量 中 的 相对 位 置 列 含 着 结 点 间 的 关系 ,如 treeLi] 的 
双亲 为 tree[LGi 十 1)/2 一 菇 ,而 其 左右 孩子 则 分 别 为 treeL[2 让 和 tree[2i 十 1] 中 。 显 然 ,这 种 
顺序 存储 结构 仅 适 于 完全 二 叉 树 ,因为 在 顺序 存储 结构 中 , 仅 以 结 点 在 向 量 中 的 相对 位 置 表 
示 结 点 之 间 的 关系 ,因此 ,一 般 的 二 又 树 也 必须 应 按 完全 二 又 树 的 形式 来 存储 ,这 就 有 可 能 
造成 存储 空间 的 浪费 。 如 图 5. 8 所 示 的 一 般 二 叉 树 , 其 存储 结构 如 图 5. 9 所 示 , 图 中 “0” 表 
示 不 存在 此 结 点 。 在 最 坏 的 情况 下 ,一 个 深度 为 且 只 有 k 个 结 点 的 单 支 树 ( 树 中 无 度 为 2 
的 结 点 ) 却 需 2* 一 1 个 存储 分 量 。 


2. 链 式 存储 结构 


由 二 叉 树 的 定义 可 知 , 二 叉 树 的 结 点 由 一 个 数据 元 素 和 分 别 指向 其 左 、 右 子 树 的 两 个 分 
支 构成 ,如 图 5.10(a) 所 示 。 也 就 是 说 ,二 又 树 的 链表 中 的 结 点 至 少 包含 三 个 域 : 数据 域 和 
左 、 布 指针 域 ,如 图 5. 10(b) 所 示 。 但 是 ,设计 不 同 的 结 点 结构 可 构成 不 同形 式 的 链 式 存储 


结构 。 有 时 ,为 了 便于 找到 结 点 的 双亲 ,还 可 以 在 
结构 中 增加 一 个 指向 其 双亲 结 点 的 指针 域 , 如 
图 5. 10(c) 所 示 。 利 用 这 两 种 结 点 结构 所 得 二 又 
树 的 存储 结构 分 别称 为 二 又 链表 和 三 叉 链表 ,如 
图 5. 11 所 示 。 链 表 的 头 指针 指向 二 又 树 的 根 结 点 。 

在 不 同 的 存储 结构 中 实现 二 又 树 的 操作 方法 
也 不 同 , 如 查找 结 点 x 的 双亲 parent(tree,x) ,在 
三 又 链表 中 很 容易 实现 ,而 在 二 又 链表 中 则 需 从 
根 结 点 出 发 巡查 。 由 此 ,在 具体 应 用 中 采用 什么 
存储 结构 , 除 考虑 二 叉 树 的 形态 之 外 还 应 考虑 需 
要 进行 何 种 操作 。 
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parent 


data 


Ichild tehild 
(a) 二 又 树 的 结 点 


lchild data rchild 

(b) 含有 两 个 指针 域 的 结 点 结构 

| lchild | data parent rchild 
《@) 含有 三 个 指针 域 的 结 点 结构 

图 5.10 二 叉 树 的 结 点 及 其 存储 结构 
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图 5.11 二 叉 树 的 链 式 存储 结构 
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G3 二 又 树 的 遍历 


5.3.1 递归 的 遍历 算法 


遍历 (traversal) 是 树 的 一 种 最 基本 的 运算 。 所 谓 遍 历 二 又 树 , 就 是 按 一 定 的 规则 和 次 
序 走 遍 二 又 树 的 所 有 结 点 ,使 得 每 个 结 点 都 被 访问 一 次 ,而 且 只 被 访问 一 次 。 遍 历 二 叉 树 的 
目的 在 于 得 到 二 叉 树 中 各 结 点 的 一 种 线性 序列 ,使 非 线 性 的 二 叉 树 线性 化 ,从 而 简化 有 关 的 
运算 和 处 理 。 对 于 线性 结构 ,遍历 的 问题 十 分 简单 , 因 其 结构 本 身 就 是 线性 的 。 但 二 叉 树 是 
非 线 性 的 ,要 得 到 树 中 各 结 点 的 一 种 线性 序列 就 不 那么 容易 。 因 为 从 二 叉 树 的 任意 结 点 出 
发 , 既 可 向 左 走 , 也 可 向 右 走 ,存在 两 种 可 能 。 所 以 ,必须 为 遍历 确定 一 个 完整 而 有 规则 的 走 
法 ,以 便 按 同样 的 方法 处 理 每 个 结 点 及 其 子 树 。 

二 叉 树 的 基本 结构 形态 如 图 5. 3 所 示 , 如 果 用 L、D、R 分 别 表示 遍历 左 子 树 ,访问 根 结 
点 .遍历 右 子 树 , 并 遵循 先 左 后 右 的 规则 ,那么 ,遍历 二 又 树 可 以 有 三 种 不 同 的 走 法 : DLR、 
LDR 、.LRD。 分 别称 为 先 根 遍历 .中 根 遍 历 、 后 根 遍 历 。 三 种 走 法 的 定义 如 下 。 


1. 先 根 遍 历 (DLR) 


若 二 叉 树 为 空 , 则 返回 ,否则 依次 执行 以 下 操作 : 
访问 根 结 点 ; 

按 先 根 遍 历 左 子 树 ; 

按 先 根 遍 历 右 子 树 ; 

返回 。 


2. 中 根 遍 历 (LDR) 


车 二 叉 树 为 空 , 则 返回 ,否则 依次 执行 以 下 操作 : 
按 中 根 遍历 左 子 树 ; 

访问 根 结 点 ; 

按 中 根 遍历 右 子 树 ; 

返回 。 

3. 后 根 遍历 (LRD) 


若 二 又 树 为 空 , 则 返回 ,否则 依次 执行 以 下 操作 

按 后 根 遍历 左 子 树 ; 

按 后 根 遍历 右 子 树 ; 

访问 根 结 点 ; 

返回 。 

根据 上 述 描述 ,对 于 图 5. 5 所 示 的 二 叉 树 : 

按 先 根 遍历 ,得 到 的 结 点 序列 是 1,2,4,8,9.5,10.11,3,6,12,7; 
按 中 根 遍 历 ,得 到 的 结 点 序列 是 8,4,9,2,10,5,11,1,12,6,3,7; 


按 后 根 遍历 ,得 到 的 结 点 序列 是 8,9,4,10,11,5,2,12.,6,7,3,1。 

对 于 图 5. 4 所 示 的 二 叉 树 : 

按 先 根 遍历 得 到 的 结 点 序列 是 1,2,4,8,9,5,10,11,3,6,12,13,7,14,15; 

按 中 根 遍历 得 到 的 结 点 序列 是 8,4,9,2,10,5,11,1,12,6,13,3,14,7,15; 

按 后 根 遍历 得 到 的 结 点 序列 是 8,9,4,10,11,5,2,12,13,6,14,15,7,3,1。 

显然 , 先 根 遍 历 、 中 根 遍历 和 后 根 遍 历 这 些 术 语 本 身 , 就 反映 着 根 结 点 相对 于 其 子 树 的 
位 置 关 系 。 

遍历 算法 的 语言 描述 形式 随 存储 结构 的 不 同 而 不 同 。 若 定义 二 叉 树 的 存储 结构 为 如 下 
说 明 的 二 又 链表 : 

typedef int datatype; 


struct bnodept 
{ 
datatype data; 
struct bnodept * lchild, * rchild; 
霹 
typedef struct bnodept * bitreptr; 


则 三 种 遍历 的 递归 算法 如 下 。 
算法 5.1 二 又 树 的 先 根 遍 历 递归 算法 。 
// 按 先 根 遍 历 二 又 树 t,t 的 每 个 根 结 点 有 三 个 域 :lchild, data, rchild 


void preorder (bitreptr t) 
{ 


if(t) // 为 非 空 二 叉 树 
{ 
visit(t—> data); // 访 问 根 结 点 


preorder(t 一 >1lchild); // 先 根 遍 历 左 子 树 
preorder(t- > rchild); // 先 根 遍 历 右 子 树 


} 
算法 5.2 ”二 又 树 的 中 根 遍 历 递归 算法 。 
// 按 中 根 遍 历 二 又 树 t,t 的 每 个 结 点 有 三 个 域 :lchild,data rchild 


void inorder(bitreptr t) 
if(t) 
‘ 
inorder(t—> lchild); 
visit(t—> data); 
inorder(t—> rchild); 


} 
算法 5.3 ”二 又 树 的 后 根 遍历 递归 算法 。 


// 按 后 根 遍历 二 叉 树 t,t 的 每 个 结 点 有 三 个 域 :1child, data, rchild 
void postorder(bitreptr 七 ) 
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if(t) 

{ 
postorder(t -> lchild); 
postorder(t —> rchild); 
visit(t—> data); 


. 


例如 ,图 5.12 所 示 的 二 叉 树 表示 下 述 表 达 式 O 
a 十 bx*(c 一 d) 一 e/f 
车 先 根 遍历 图 5. 12 所 示 的 二 叉 树 , 按 访问 结 点 的 © 人 
先后 次 序 将 结 点 排列 起 来 ,可 得 二 又 树 的 先 根 序列 为 ; © OE DB 
一 十 a*b 一 cd/ef 9. 
类 似 地 ,中 根 遍 历 图 5. 12 所 示 的 二 叉 树 ,可 得 此 ©) 
二 叉 树 的 中 根 序列 为 : @ (d) 
a 二 bxc—d—e/f (5.4) 
后 根 遍 历 图 5. 12 所 示 的 二 叉 树 的 序列 为 ; ee 
abcd 一 * 十 ef/ 一 KS. 5 
从 表达 式 来 看 ,以 上 三 个 序列 恰好 为 表达 式 的 前 缀 表示 (波兰 式 ) ,中 组 表示 和 后 级 表示 
( 道 波 兰 式 )。 


从 上 述 二 叉 树 遍历 的 定义 可 知 , 三 种 遍历 算法 的 不 同 之 处 仅 在 于 访问 根 结 点 和 遍历 左 、 
右 子 树 的 先后 次 序 不 同 。 如 果 在 算法 中 暂且 抹 去 与 递归 无 关 的 visit 语句 , 则 三 个 遍历 算法 
完全 相同 。 因 此 ,从 递归 执行 的 过 程 角度 来 看 , 先 根 、 中 根 和 后 根 遍 历 也 是 完全 相同 的 。 
图 5.13(b) 中 用 带 箭头 的 虚线 表示 了 这 三 种 遍历 算法 的 递归 执行 过 程 。 其 中 向 下 的 箭头 表 
示 更 深 一 层 的 递归 调用 ,向 上 的 箭头 表示 从 递归 调用 退出 返回 ,虚线 旁 的 字符 表示 了 中 根 遍 
历 二 又 树 过 程 中 访问 结 点 时 输出 的 信息 。 巾 于 中 根 遍 历 中 访问 根 结 点 是 在 遍历 左 子 树 之 
后 .遍历 右 子 树 之 前 进行 的 , 则 带 圆 形 的 字符 标 在 向 左 递 归 返 回 和 向 右 调 用 之 间 。 由 此 ,只 
要 沿 虚线 从 1 出 发 到 2 结束 ,将 沿途 所 见 的 圆 形 内 的 字符 记 下 , 便 得 到 二 又 树 的 中 根 序列 
例如 ,从 图 5.13(b) 可 得 图 5. 13(a) 所 示 表 达 式 的 中 根 序列 为 : ax b 一 c。 


| 


QO (3) 
Gf © ; 5 
G 
a b 
GO) Ly 全 
(a) 表达 式 (a*b-c) 的 二 叉 树 表示 (b) 遍历 的 递归 执行 过 程 


图 5.13 三 种 遍历 过 程 示意 图 


执行 一 个 递归 程序 ,需要 借助 栈 的 作用 ,因此 可 以 直接 使 用 栈 ,把 上 面 的 递归 算法 改写 
成 一 个 等 价 的 非 递归 算法 。 
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在 遍历 二 叉 树 的 过 程 中 ,通过 根 结 点 可 以 立刻 找到 它 的 左 孩 子 ( 即 左 子 树 的 根 结 点 ) 和 
右 孩 子 ( 即 右 子 树 的 根 结 点 ) ,但 不 能 直接 从 左 孩 子 或 右 孩 子 到 达 它 的 双亲 ,除非 重新 从 二 叉 
树 的 根 开 始 扫 描 。 对 于 前 根 遍 历 二 叉 树 而 言 ,在 访问 根 结 点 之 后 ,可 以 直接 到 达 左 子 树 进行 
遍历 ; 在 左 子 树 遍历 完毕 之 后 ,还 必须 设法 从 左 子 树 返回 到 根 结 点 ,再 到 达 它 的 右 子 树 进 行 
人 遍历。 因此 ,在 从 根 结 点 走向 左 子 树 之 前 ,必须 将 根 结 点 的 指针 送 入 一 个 栈 中 暂 存 起 来 。 这 
样 , 在 左 子 树 遍历 完毕 之 后 ,再 从 栈 中 取 回 根 结 点 的 指针 , 便 得 到 了 根 结 点 的 地 址 ,再 走向 右 
子 树 进 行 遍历 。 

算法 5.4 ”前 根 遍 历 二 又 树 的 非 递归 算法 。 


void preorder(bitreptr 七 ) 
{ 


bitreptr stack[MAX+1]; // 顺 序 栈 
int top= 0; // 栈 顶 指针 
do 
{ 
while(t) 
{ 
visit(t 一 > data); // 访 问 根 结 点 
if(top == MAX) // 栈 已 满 
{ 
printf("stack full"); 
return; // 不 能 再 遍历 下 去 
} 
stack[ ++top] = t; // 根 指针 进 栈 
t=t->1child; // 移 向 左 子 树 
if(top!= 0) // 栈 中 还 有 根 指针 
{ 
t= stack[top—— ]; // 取 出 根 指针 
t=t->rchild; // 移 向 右 子 树 
}while(top!= 0| |t!= NULL); // 栈 非 空 或 为 非 空子 树 


} 


对 二 又 树 进行 遍历 的 搜索 路 径 除 了 按 先 根 、 中 根 或 后 根 外 ,还 可 以 从 上 到 下 、 从 左 到 右 
按 层次 进行 。 

显然 ,遍历 二 叉 树 的 算法 中 的 基本 操作 是 访问 根 结 点 ,无 论 按 哪 一 种 次 序 进 行 遍 历 ,对 
含 n 个 结 点 的 二 叉 树 ,其 时 间 复 杂 度 均 为 O(n)。 所 需 辅助 空间 为 遍历 过 程 中 栈 的 最 大 容 
量 , 即 树 的 深度 ,最 坏 情况 下 为 n, 则 空间 复杂 度 也 为 O(n)。 遍 历时 也 可 采用 二 叉 树 的 其 他 
存储 结构 ,如 带 标 志 域 的 三 叉 链 表 . 此 时 因 存 储 结构 中 已 存储 遍历 所 需 的 足够 信息 , 则 遍历 
过 程 中 不 需 另 设 栈 。 另 外 ,采用 带 标志 域 的 二 叉 链表 做 存储 结构 ,并 在 遍历 过 程 中 利用 指针 
域 暂 存 遍历 路 径 , 也 可 省 略 栈 的 空间 ,但 这 样 做 将 使 时 间 上 有 很 大 损失 。 


5.3.2 二 义 树 遍历 操作 应 用 举例 


遍历 是 二 又 树 各 种 操作 的 基础 ,可 以 在 遍历 过 程 中 对 结 点 进行 各 种 操作 ,如 对 于 一 棵 已 
知 二 叉 树 可 求 结 点 的 双亲 , 求 结 点 的 孩子 结 点 、 判 定 结 点 所 在 层次 等 ,反之 ,也 可 以 在 遍历 过 
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程 中 生成 结 点 ,建立 二 又 树 的 存储 结构 。 


(1) 求 二 又 树 中 以 值 为 x 的 结 点 为 根 的 子 树 的 深度 。 
算法 5.5 求 二 又 树 中 值 为 x 的 结 点 为 根 的 子 树 的 深度 算法 。 


// 求 子 树 深度 的 递归 算法 
int Get Depth(bitreptr T) 
{ 
int m,n; 
if(!T) return 0; // 递 归 函 数 有 返回 值 时 注意 对 每 个 分 支 赋 值 
else 
{ 
m= Get_Depth(T- > 1child); 
n= Get_Depth(T- > rchild); 
return (m> n?m:n) +1; 
} 
// 求 二 又 树 中 以 值 为 x 的 结 点 为 根 的 子 树 深度 
void Get_Sub Depth(bitreptr T, datatype x) 
{ 
if(T—-> data== x) 
printf(" % d\n",Get Depth(T)); // 找 到 了 值 为 x 的 结 点 , 求 其 深度 
exit(1); 
} 
else 
{ 
if(T—->1child) 
Get_Sub Depth(T—> lchild, x); 
if(T—->rchild) 
Get_Sub Depth(T- > rchild,x); // 在 左 、 右 子 树 中 继续 寻找 


} 


(2) 在 二 叉 树 中 求 指定 结 点 的 层 数 。 
算法 5.6 在 二 又 树 中 求 指定 结 点 的 层 数 算法 。 


// 在 二 叉 树 root 中 求 值 为 ch 的 结 点 所 在 的 层 数 
int preorder(bitreptr root, datatype ch) 
{ 

int lev,m,n; 

if(root == NULL) 


lev= 0; // 空 树 

else if (root -> data== ch) 
lev=1; //ch 所 在 结 点 为 根 结 点 
else 


{ 

m= preorder(root -> lchild, ch); // 在 左 子 树 中 查找 ch 所 在 结 点 

n= preorder(root -> rchild, ch); // 在 右 子 树 中 查找 ch 所 在 结 点 

if (m==0&sn==0) lev=0; // 在 左 、 右 子 树 中 查找 失败 

else lev= ((m>n)?m:n) +1; // 在 左 子 树 或 右 子 树 中 查找 成 功 时 , 层 数 加 1 
} 


return( lev); 
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(3) 按 先 根 序列 建立 二 又 树 的 二 又 链表 。 
对 图 5. 11(b) 所 示 的 二 叉 树 , 按 下 列 次 序 顺序 读 入 字符 ,其 中 # 作 为 结束 标志 。 
ABC 间 DE#G 提 并 下 间 提 # 
算法 5.7 按 先 根 序列 建立 二 叉 树 的 二 又 链 表 算法 。 
// 按 先 根 序列 建立 二 叉 树 的 二 叉 链表 . 函数 的 返回 值 指向 根 结 点 


bitreptr crt_bt pre() 
{ 


char ch; 

bitreptr bt; 

ch = getchar(); // 从 键盘 上 输入 一 个 字符 
if (ch== '#') return(NULL); //# 作 为 结束 标志 

else 


{ 
bt = (bitreptr)malloc(sizeof(struct bnodept));  // 产 生 新 结 点 
bt 一 > data = ch; 
bt—->1child= crt bt pre(); 
bt 一 > rchild= crt bt pre(); 
return (bt) 


} 


(4) 求 二 又 树 的 叶子 数 。 

可 以 将 此 问题 视 为 一 种 特殊 的 遍历 问题 ,这 种 遍历 中 * 访 问 一 个 结 点 ”的 具体 内 容 为 判 
断 该 结 点 是 不 是 叶子 ,若是 则 将 叶子 数 加 1。 显 然 可 以 采用 任何 遍历 方法 ,这 里 用 先 根 
遍历 。 

算法 5.8 求 二 叉 树 的 叶子 数 算法 。 

// 先 根 遍历 根 指针 为 root 的 二 叉 树 以 计算 其 叶子 数 


int countleaf (bitreptr root) 
{ 
int 15 
if(root == NULL) 
i=0; 
else if((root ->1child== NULL)&&(root -> rchild== NULL)) 
i1=1; 
else 
i= countleaf(root—> lchild) + countleaf(root 一 > rchild); 


return(i); 


6.4 线索 二 又 树 


5.4.1 线索 二 叉 树 的 定义 
当 用 二 又 链表 作为 二 又 树 的 存储 结构 时 ,由 于 每 个 结 点 中 只 有 指向 其 左 、 右 孩子 结 点 的 
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指针 域 ,所 以 从 任 一 结 点 出 发 只 能 直接 找到 该 结 点 的 左 、 右 孩子 ,一 般 情况 下 无 法 直接 找到 
该 结 点 在 某 种 遍历 序列 中 的 前 驱 和 后 继 结 点 。 为 此 , 若 在 每 个 结 点 中 增加 两 个 指针 域 来 存 
放 遍 历时 得 到 的 前 驱 和 后 继 信息 , 则 将 大 大 降低 存储 空间 的 利用 率 。 由 于 在 n 个 结 点 的 二 
又 链表 中 含有 ?7 十 1 个 空 指针 域 , 因 此 可 以 利用 这 些 空 指针 域 ,存放 指向 结 点 在 某 种 遍历 次 
序 下 的 前 驱 和 后 继 结 点 的 指针 ,这 种 附加 的 指针 称 为 线索 ,加 上 了 线索 的 二 又 链表 称 为 线索 
链表 ,相应 的 二 叉 树 称 为 线索 二 叉 树 (threaded binary tree) 。 

为 了 区 分 一 个 结 点 的 指针 域 是 指向 其 孩子 的 指针 ,还 是 指向 其 前 驱 或 后 继 的 线索 ,可 在 
每 个 结 点 中 增加 两 个 标志 域 ,这 样 ,线索 链表 中 的 结 点 结构 为 : 


lchild ltag data rtag rchild 


其 中 : 左 标志 ltag 二 0 表示 lchild 是 指向 结 点 的 左 孩 子 的 指针 ; 否则 ,为 指向 结 点 的 前 
驱 的 左 线索 。 右 标志 rtag 二 0 表示 rchild 是 指向 结 点 的 右 孩 子 的 指针 ; 否则 ,为 指向 结 点 的 
后 继 的 右 线索 。 

如 图 5. 14(a) 所 示 的 中 根 线索 二 又 树 , 它 的 线索 链表 见 图 5. 14(b)。 图 中 的 实 线 表示 指 
针 , 虚 线 表示 线索 。 结 点 C 的 左 线索 为 空 ,表示 C 是 中 根 序列 的 开始 结 点 , 它 没有 前 驱 ; 结 
点 下 的 右 线 索 为 空 ,表示 下 是 中 根 序 列 的 终端 结 点 , 它 没 有 后 继 。 显 然 在 线索 二 又 树 中 ,一 
个 结 点 是 叶子 结 点 的 充 要 条 件 是 : 它 的 左 , 右 标 志 均 是 1。 


NULL 


人 


[al 
(b) 中 根 线索 链表 
图 5.14 中 根 线 索 二 又 树 及 其 存储 结构 


将 二 叉 树 转换 为 线索 二 叉 树 的 过 程 称 为 线索 化 。 按 某 种 次 序 将 二 又 树 线索 化 ,只 要 按 
该 次 序 遍历 二 又 树 ,在 遍历 过 程 中 用 线索 取代 空 指针 即 可 。 为 此 ,附加 一 个 指针 pre 始终 指 
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向 刚 访问 过 的 结 点 ,而 指针 p 指向 当前 正在 访问 的 结 点 。 显 然 结 点 * pre 是 结 点 * p 的 前 
了 驱 , 而 x*p 是 x pre 的 后 继 。 下 面 给 出 将 二 叉 树 按 中 根 线索 化 的 算法 。 该 算法 与 中 根 遍历 算 
法 类 似 , 只 需要 将 遍历 算法 中 访问 结 点 *p 的 操作 具体 化 为 在 *p 及 其 中 根 前 驱 * pre( 若 
pre! 二 NULL) 之 间 建 立 线 索 的 操作 即 可 。 显 然 pre 的 初 值 应 为 NULL。 

算法 5.9 二 又 树 中 根 线索 化 算法 。 


typedef int datatype; 
typedef enum {link, thread} pointertag; // 枚 举 值 link 和 thread 分 别 为 0,1 
typedef struct node 
{ 
datatype data; 
pointertag ltag, rtag; // 左 、 右 标志 
struct node * lchild, * rchild; 
}binthrnode; 
typedef binthrnode * binthrtree; 
binthrnode * pre= NULL; // 全 局 变量 
void in thread(binthrtree p) 


if(p) //p 非 空 时 , 当前 访问 结 点 是 *P 
{ 
in_thread(p—> lchild); // 左 子 树 线索 化 


// 以 下 直至 右 子 树 线索 化 之 前 相当 于 遍历 算法 中 访问 结 点 的 操作 
p-> ltag= (p-> lchild)?1ink:thread; 
// 左 指针 非 空 时 左 标志 为 link( 即 为 0), 否则 为 thread( 即 1) 
p->rtag= (p-> rchild)?1ink:thread; 


if (pre) // 若 *p 的 前 驱 * pre 存在 
{ if(pre->rtag== thread) //*Pp 的 前 驱 右 标志 为 线索 
pre—>rchild=p; // 令 * pre 的 右 线 索 指 向 中 根 后 继 
if(p-> ltag== thread) //*p 的 左 标志 为 线索 
p->1child= pre; // 令 *p 的 左 线索 指向 中 根 前 驱 
下 
pre=p; // 令 pre 时 下 一 访问 结 点 的 中 根 前 驱 


in thread(p— > rchild); 
l 
} 


显然 ,和 中 根 遍历 算法 一 样 ,递归 过 程 中 对 每 个 结 点 仅 做 一 次 访问 ,因此 对 于 个 结 点 
的 二 又 树 ,算法 的 时 间 复 杂 度 也 为 O(n)。 
类 似 地 可 得 前 根 线索 化 和 后 根 线索 化 算法 。 


5.4.2 线索 二 叉 树 的 常用 运算 
下 面 介 绍 线索 二 又 树 上 两 种 常用 的 运算 。 
1. 查找 某 结 点 * p 在 指定 次 序 下 的 前 驱 和 后 继 结 点 


在 中 根 线索 二 又 树 中 ,查找 结 点 * p 的 中 根 线索 后 继 结 点 分 以 下 两 种 情形 。 
(1) 若 * p 的 右 子 树 为 空 ( 即 p> rtag 为 thread) , 则 p-> rchild 为 右 线 索 ,直接 指向 *p 
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的 中 根 后 继 。 例 如 ,图 5.14 中 DD 的 中 根 后 继 是 A。 

(2) 若 *p 的 右 子 树 非 空 ( 即 p> rtag 为 link) , 则 * p 的 中 根 后 继 必 是 其 右 子 树 中 第 一 
个 中 根 遍 历 到 的 结 点 ,也 就 是 从 * p 的 右 孩 子 开始 , 沿 该 孩子 的 左 链 往 下 查找 ,直到 找到 一 
个 没有 左 孩 子 的 结 点 为 止 。 该 结 点 是 *p 的 右 子 树 中 最 左下 的 结 点 , 它 就 是 * p 的 中 根 线 
索 后 继 结 点 。 如 图 5. 15 所 示 ,*p 的 中 根 线索 后 继 结 点 是 Ri (k 宇 1)。R 可 能 有 右 孩 子 也 
可 能 无 右 孩子 , 若 Re 无 右 孩 子 , 则 它 必 定 是 叶 结 点 。 若 & 王 1, 则 表示 *p 的 右 孩 子 Ri 是 
xp 的 中 根 线索 后 继 ,如 图 5. 14 中 ,A 的 中 根 线索 后 继 是 F, 它 有 右 孩 子 ; F 的 中 根 线索 后 
继 是 了 H, 它 无 右 孩 子 ; B 的 中 根 线索 后 继 是 D, 它 是 B 的 右 孩 子 ( 即 D 相当 于 是 R, ) 。 


Ri 一 一 最 右 下 结 点 


(a) 结 点 *p 的 右 子 树 非 空 时 其 中 根 线索 后 继 结 点 Ri 示例 


和 [la 
上 0 R2 
1IRd4 | | 

(b) 结 点 *p 的 右 子 树 非 空 时 中 根 线索 后 继 结 点 存储 结构 
图 5.15 结 点 *p 的 右 子 树 非 空 时 其 中 根 线索 后 继 结 点 是 Rs 


基于 上 述 分 析 ,不 难 给 出 中 根 线索 二 又 树 中 求 中 根 线索 后 继 结 点 的 算法 。 
算法 5. 10 ”中 根 线 索 二 又 树 中 求 中 根 线 索 后 继 结 点 算法 。 


// 在 中 根 线索 树 中 找 结 点 * p 的 中 根 线索 后 继 , 设 p 非 空 
binthrnode * in_succ(binthrnode * p) 
{ 

binthrnode *q; 


if (p—> rtag== thread) //*p 的 右 子 树 为 空 
return p 一 > rchild; // 返 回 右 线索 所 指 的 中 根 线 索 后 继 
else 


{ 
q=p->rchild; 
while (q—> ltag == link) 
q=q-> lchild; // 左 子 树 非 空 时 , 沿 左 链 往 下 查找 
Be // 当 aq 的 左 子 树 为 空 时 , 它 就 是 最 左下 结 点 
} 
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显然 ,该 算法 的 时 间 复 杂 度 不 超过 树 的 高 度 h, 即 O(h)。 

由 于 中 根 遍历 是 一 种 对 称 遍 历 操作 , 故 在 中 根 线 索 二 又 树 中 查找 结 点 *p 的 中 根 线索 
前 驱 结 点 与 找 中 根 线索 后 继 结 点 的 方法 完全 对 称 。 若 * p 的 左 子 树 为 空 , 则 p-> lchild 为 左 
线索 ,直接 指向 * p 的 中 根 线索 前 驱 结 点 ; 若 * p 的 左 子 树 非 空 , 则 从 * p 的 左 孩子 出 发 , 沿 
右 指针 链 往 下 查找 ,直到 找到 一 个 没有 右 孩 子 的 结 点 为 止 。 该 结 点 是 *p 的 左 子 树 中 最 右 
下 的 结 点 , 它 是 *p 的 左 子 树 中 最 后 一 个 中 根 线索 遍历 到 的 结 点 , 即 x p 的 中 根 线索 前 驱 结 


点 ,如 图 5.16 所 示 。 
p 
P 
p> 


Re Ra| 


最 右 下 结 点 


辣 


(a) 结 点 *p 中 根 线索 前 驱 结 点 Ri 示例 (b) 结 点 4p 中 根 线索 前 驱 结 点 Re 存储 结构 
图 5.16 结 点 *p 的 左 子 树 非 空 时 ,其 中 根 线索 前 驱 结 点 是 Rs 


由 上 述 讨论 可 知 : 若 结 点 * p 的 左 子 树 (或 右 子 树 ) 非 空 , 则 * p 的 中 根 线索 前 驱 ( 或 中 
根 线索 后 继 ) 是 从 * p 的 左 孩 子 (或 右 孩 子 ) 开 始 往 下 查找 ,由 于 二 叉 链表 中 结 点 的 链 域 是 向 
下 链接 的 ,所 以 在 非 线索 二 叉 树 中 也 同样 容易 找到 x*p 的 中 根 线索 前 驱 ( 或 中 根 线索 后 继 ); 
若 结 点 * p 的 左 子 树 (或 右 子 树 ) 为 空 , 则 在 中 根 线 索 二 又 树 中 是 通过 *p 的 左 线索 (或 右 线 
索 ) 直 接 到 找到 * p 的 中 根 线索 前 驱 (或 中 根 线索 后 继 ) ,但 中 根 线 索 一 般 都 是 向 上 指向 其 祖 
先 结 点 ,而 二 又 链表 中 没有 向 上 的 链接 ,因此 在 这 种 情况 下 ,对 于 非 线 索 二 叉 树 , 仅 从 *p 出 
发 无 法 找到 其 中 根 线 索 前 驱 (或 中 根 线 索 后 继 ) ,而 必须 从 根 结 点 开始 中 根 线索 遍历 ,才能 找 
到 *p 的 中 根 线索 前 驱 ( 或 中 根 线索 后 继 )。 由 此 可 见 ,线索 使 得 查找 中 根 线索 前 驱 和 中 根 线 
索 后 继 变 得 简单 有 效 ,而 对 于 查找 指定 结 点 的 前 根 线索 前 驱 和 后 根 线索 后 继 却 没有 什么 帮助 。 

在 后 根 线索 二 又 树 中 ,查找 指定 结 点 * p 的 后 根 线索 前 驱 结 点 的 规律 是 : 

(1) 若 * p 的 左 子 树 为 空 , 则 p-> lchild 是 前 驱 线 索 ,指示 其 后 根 线索 前 驱 结 点 。 例 如 ， 
在 图 5.17 中 ,HH 的 后 根 线索 前 驱 是 B,F 的 后 根 线索 前 驱 是 G。 

(2) 若 *p 的 左 子 树 为 非 空 , 则 p-> lchild 不 是 前 驱 线 索 。 但 因为 在 后 根 遍 历时 , 根 是 在 
遍历 其 左右 子 树 之 后 被 访问 的 , 故 * p 的 后 根 线索 前 驱 必 是 两 子 树 中 最 后 一 个 遍历 到 的 结 
点 。 因 此 , 当 *p 的 右 子 树 非 空 时 , * p 的 右 孩 子 必 是 其 后 根 线索 前 驱 , 例 如 ,图 5.17 中 人 A 
的 后 根 线索 前 驱 是 E; 当 *p 无 右 子 树 时 ,*p 的 后 根 线索 前 驱 必 是 其 左 孩 子 , 如 图 5. 17 中 
三 的 后 根 线索 前 驱 是 F。 

在 后 根 线 索 二 又 树 中 ,查找 指定 结 点 * p 的 后 根 线索 后 继 结 点 的 规律 是 : 

(1) 车 *p 是 根 , 则 x*p 是 该 二 叉 树 后 根 遍 历 过 程 中 最 后 一 个 访问 到 的 结 点 ,因此 , *p 
的 后 根 线索 后 继 为 空 。 
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图 5.17 后 根 线索 二 叉 树 


(2) 若 * p 是 其 双亲 的 右 孩 子 , 则 x*p 的 后 根 线索 后 继 结 点 就 是 其 双亲 结 点 ,如 图 5. 17 
中 ,E 的 后 根 线索 后 继 是 A。 

(3) 若 * p 是 其 双亲 的 左 孩子 ,但 * p 无 右 见 弟 时 , x p 的 后 根 线索 后 继 结 点 是 其 双亲 
结 点 ,如 图 5.17 中 ,F 的 后 根 线索 后 继 是 E。 

(4) 车 *p 是 其 双亲 的 左 孩 子 , 但 * p 有 右 兄 弟 时 , 则 *p 的 后 根 线索 后 继 结 点 是 其 双 
亲 的 右 子 树 中 第 一 个 后 根 线 索 遍 历 到 的 结 点 , 它 是 该 子 树 中 “最 左下 的 叶 结 点 ”。 例 如 图 5. 17 
中 ,B 的 后 根 线索 后 继 是 双亲 A 的 右 子 树 中 最 左下 的 叶 结 点 了 HH。 注意 ,F 是 孩子 树 中 最 左 
下 结 点 ,但 它 不 是 叶子 。 

由 上 述 讨论 可 知 ,在 后 根 线 索 树 中 , 仅 从 *p 出 发 就 能 找到 其 后 根 线 索 前 驱 结 点 ; 而 找 
xp 的 后 根 线索 后 继 结 点 , 仅 当 * p 的 右 子 树 为 空 时 ,才能 直接 由 x*p 的 右 线索 p-> rchild 得 
到 ,和 否则 就 必须 知道 * p 的 双亲 结 点 才能 找到 其 后 根 线索 后 继 。 因 此 ,如 果 线 索 二 又 树 中 的 
结 点 没有 指向 其 双亲 结 点 的 指针 ,就 可 能 要 从 根 开始 进行 后 根 线索 遍历 才能 找到 结 点 * p 
的 后 根 线索 后 继 。 由 此 可 见 ,线索 对 查找 指定 结 点 的 后 根 线索 后 继 并 无 多 大 帮助 。 

类 似 地 ,在 先 根 线索 二 叉 树 中 , 找 某 一 点 * p 的 先 根 线索 后 继 也 很 简单 , 仅 从 * p 出 发 
就 可 以 找到 ; 但 找 其 先 根 线索 前 驱 也 必须 知道 *p 的 双亲 结 点 , 当 树 中 结 点 未 设 双亲 指针 
时 ,同样 要 进行 从 根 开始 的 先 根 线索 遍历 才能 找到 结 点 * p 的 先 根 线索 前 驱 。 详 细 过 程 建 
议 读者 自行 分 析 。 

2. 遍历 线索 二 叉 树 


遍历 某 种 次 序 的 线索 二 叉 树 ,只 要 从 该 次 序 下 的 开始 结 点 出 发 ,反复 找到 结 点 在 该 次 序 
下 的 后 继 ,直至 终端 结 点 。 这 对 于 中 根 和 先 根 线 索 二 叉 树 是 十 分 简单 的 。 下 面 给 出 中 根 遍 


历 算法 。 
算法 5.11 遍历 中 根 线索 二 又 树 算法 。 
void traverseinorderthrtree(binthrtree p) // 遍 历 中 根 线索 二 叉 树 
{ 
if(p) // 树 非 空 
{ 
while (p—> ltag== link) 
p=p->1child; // 从 根 往 下 找 最 左下 结 点 , 即 中 根 序列 的 开始 结 点 
do 
{ 
printf(" %c",p—> data); // 访 问 结 点 
p= in succ(p); // 找 * p 的 中 根 线索 后 继 


}while(p); 


} 


由 于 中 根 序 列 的 终端 结 点 的 右 线索 为 空 ,所 以 do 语句 的 终止 条 件 是 p 王 一 NULL。 显 
然 , 该 算法 的 时 间 复 杂 度 为 O(n) ,但 因为 它 是 非 递归 算法 ,所 以 在 常数 因子 上 小 于 递归 的 
遍历 算法 。 因 此 , 若 对 一 棵 二 又 树 要 经 常 遍历 ,或 查找 结 点 在 指定 次 序 下 的 前 驱 和 后 继 , 则 
应 采用 线索 链表 作为 存储 结构 为 宜 。 

本 节 介 绍 的 线索 二 叉 树 是 一 种 全 线索 树 , 即 左 、 右 线索 均 要 建立 ,但 在 许多 应 用 中 只 要 
建立 左 、 右 线索 中 的 一 种 即 可 。 此 外 , 若 在 线索 链表 中 增加 一 个 头 结 点 , 令 头 结 点 的 左 指针 
指向 根 , 右 指针 指向 其 遍历 序列 的 开始 或 终端 结 点 会 更 方便 。 


Es 一 般 树 的 表示 和 遍历 


5.5.1 一 般 树 的 表示 


在 实际 应 用 中 , 树 ( 这 里 特 指 非 二 又 树 ) 有 多 种 存储 结构 。 下 面 介 绍 三 种 常用 的 链表 
结构 。 


1. 双亲 表示 法 
假设 以 一 组 连续 的 空间 存储 树 的 结 点 ,同时 在 每 个 结 点 中 附设 一 个 指示 器 指示 其 双亲 
结 点 在 链表 中 的 位 置 ,其 形式 说 明 如 下 : 
# define MAXNODE // 最 大 结 点 数 
typedef struct 
{datatype data; // 数 据 域 
int parent:; // 双 亲 域 (静态 指针 域 ) 
}tnode 
typedef tnode tree[ MAXNODE + 1]; // 静 态 双 亲 链 表 


图 5. 18 展示 了 一 棵 树 及 其 双亲 表示 的 存储 结构 。 
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这 种 存储 结构 利用 了 每 个 结 点 (除根 以 外 ) 只 有 唯一 双亲 的 性 质 。 反 复 进行 求 双亲 的 操 
作 ,直到 遇 到 无 双亲 的 结 点 时 , 便 找到 了 树 的 根 。 但 是 ,在 这 种 表示 法 中 , 求 结 点 的 孩子 时 ， 
需要 遍历 整个 向 量 。 


2. 孩子 表示 法 


这 种 存储 方式 可 以 有 两 种 结 点 结构 。 一 种 结构 根据 树 中 每 个 结 点 可 以 有 多 棵 子 树 , 则 
可 用 多 重 链表 , 即 每 个 结 点 有 多 个 指针 域 , 其 中 每 个 指针 指向 一 棵 子 树 的 根 结 点 ,此 时 链表 
中 的 结 点 可 以 有 两 种 格式 : 一 种 格式 称 为 同 构 格式 , 即 若 树 的 度 是 d , 则 每 个 结 点 就 有 qd 个 
指针 域 。 但 是 ,如 果树 中 很 多 结 点 的 度 小 于 d ,链表 中 就 会 有 许多 空 链 域 ,造成 较 大 的 空间 
浪费 。 另 一 种 格式 称 为 异 构 格 式 ,每 个 结 点 的 指针 域 的 个 数 与 该 结 点 的 度数 相同 ,这 种 方式 
虽 能 节约 空间 ,但 操作 不 便 。 

还 有 一 种 办 法 是 把 每 个 结 点 的 孩子 结 点 排列 成 一 个 线性 表 , 以 单 链表 作为 存储 结构 , 则 
nn 个 结 点 就 有 nn 个 孩子 链表 (叶子 的 孩子 链表 为 空 表 )。 而 个 头 指针 又 组 成 一 个 线性 表 , 为 
了 便于 查找 ,由 这 个 头 指针 组 成 的 线性 表 可 用 向 量 表示 。 这 种 存储 结构 形式 说 明 如 下 : 

typedef struct node 

{int child; 

struct node * next; 

}* link; 

typedef link tree[MAXNODE + 1]; 

图 5.19(a) 是 图 5. 18 中 的 树 的 孩子 表示 法 。 与 双亲 表示 法 相反 ,孩子 表示 法 便于 那些 
涉及 孩子 的 操作 , 却 不 适用 于 求 双 亲 的 操作 。 也 可 以 把 双亲 表示 法 和 孩子 表示 法 结合 起 来 ， 
即将 双亲 向 量 和 和 孩子 表 头 指针 向 量 合 在 一 起 。 图 5. 19(b) 就 是 这 样 一 种 存储 结构 , 它 和 
图 5. 19(a) 表 示 的 是 同一 棵 树 。 
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(b) 带 双 亲 的 孩子 链表 


图 5.19 图 5.18 所 示 树 的 另外 两 种 表示 法 


3. 孩子 兄弟 表示 法 


孩子 兄弟 表示 法 又 称 二 又 树 表示 法 或 二 义 链 表 表 示 法 。 即 以 二 又 链表 作为 树 的 存储 结 
构 。 链 表 中 结 点 的 两 个 链 域 分 别 指向 该 结 点 的 第 一 个 孩子 结 点 和 下 一 个 兄弟 结 点 ,分 别 命 
名 为 fch 域 和 nsib 域 。 

typedef struct tnodetp 

{ 

datatype data; 
tnodetp * fch, * nsib; 

}* tlinktp; 

图 5. 20 是 图 5. 18 中 的 树 的 孩子 兄弟 链表 表示 法 。 利 用 这 种 存储 结构 便于 实现 各 类 树 
的 操作 。 首 先 易 于 实现 找 结 点 孩子 等 的 操作 。 例 如 : 若 要 访问 结 点 x 的 第 i 个 孩子 , 则 只 
要 先 从 fch 域 找到 第 一 个 孩子 结 点 ,然后 沿 着 孩子 结 点 的 nsib 域 连续 走 i 一 1 步 , 便 可 找到 
x 的 第 i 个 孩子 。 当 然 , 如 果 为 每 个 结 点 增设 一 个 parent 域 ,也 同样 能 方便 地 实现 求 双亲 的 
操作 。 
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图 5.20 图 5.18 中 树 的 二 叉 链表 表示 法 
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5.5.2 二 义 树 与 树 、 森 林 之 间 的 转换 
1. 二 叉 树 与 树 之 间 的 转换 


由 于 二 又 树 和 树 都 可 用 二 叉 链表 作为 存储 结构 ,因此 以 二 又 链表 作为 媒介 可 导出 树 与 
二 叉 树 之 间 的 一 个 对 应 关系 。 也 就 是 说 ,给 定 一 棵 树 ,可 以 找到 唯一 的 一 棵 二 叉 树 与 之 对 
应 ,从 物理 结构 来 看 ,它们 的 二 又 链表 是 相同 的 ,只 是 解释 不 同 而 已 。 

图 5. 21 直观 地 展示 了 树 与 二 又 树 之 间 的 对 应 关系 。 


2. 二 叉 树 与 森林 之 间 的 转换 


从 树 的 二 叉 链表 表示 的 定义 可 知 ,任何 一 棵 与 树 对 应 的 二 叉 树 ,其 根 的 右 子 树 必 为 空 。 
若 把 森林 中 第 二 棵 树 的 根 结 点 看 成 是 第 一 棵 树 的 根 结 点 的 兄弟 , 则 同样 可 导出 森林 和 二 叉 
树 的 对 应 关系 。 

图 5. 22 展示 了 森林 与 二 又 树 之 间 的 对 应 关系 。 

这 种 一 一 对 应 的 关系 使 得 森林 或 树 与 二 叉 树 可 以 相互 转换 ,其 形式 定义 如 下 。 

1) 森林 转换 成 二 又 树 

如 果 下 三 {TT ,T: To) 是 森林 , 则 可 按 如 下 规则 转换 成 一 棵 二 又 树 B 二 (root,LB,RB)。 
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图 5.21 树 与 二 叉 树 之 间 的 对 应 关系 示例 
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图 5.22 森林 与 二 叉 树 的 对 应 关系 示例 


@ 若 下 为 空 , 即 冯 王 0, 则 也 为 空 树 。 

@ 若 下 为 非 空 , 即 关 和 0, 则 吾 的 根 root 即 为 森林 中 第 一 棵 子 树 的 根 root(T1); B 的 
左 子 树 LB 是 从 Ti 中 根 结 点 的 子 树 森 林 下 ,二 {Tn .Tis ,… ,Ti ) 转 换 而 成 的 二 又 树 ; 其 右 
子 树 RB 是 从 森林 下 ' 二 {TT,,T;,….T, }) 转 换 而 成 的 二 叉 树 。 

2) 二 又 树 转换 成 森林 

如 果 B= 二 (root,LB,RB) 是 一 棵 二 叉 树 , 则 可 按 如 下 规则 转换 成 森林 下 一 (人 Ti ,T,,…,T,, } 。 
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车 B 为 空 , 则 下 为 空 。 

@ 车 B 为 非 空 , 则 下 中 第 一 棵 树 T, 的 根 root(T,) 即 为 二 又 树 B 的 根 root; Ti 中 根 
结 点 的 子 树 森 林 下 , 是 由 B 的 左 子 树 LB 转换 而 成 的 森林 ; FF 中 除 T;, 之 外 其 余 的 树 组 成 的 
森林 下 ' 二 {T,,T,,…,T,) 是 由 B 的 右 子 树 RB 转换 而 成 的 森林 。 

从 上 述 递归 定义 容易 写 出 相互 转换 的 递归 算法 。 这 样 ,森林 和 树 的 操作 就 可 以 转换 成 
二 叉 树 的 操作 来 实现 ,从 而 简化 了 操作 方法 。 


5.5.3 一 般 树 的 遍历 
与 二 又 树 类 似 , 遍 历 是 树 的 一 种 重要 运算 。 树 的 主要 遍历 方法 有 以 下 三 种 。 
1. 先 根 遍 历 (与 对 应 的 二 叉 树 的 先 根 遍历 序列 一 致 ) 


若 树 非 空 , 则 : 
(1) 访问 根 结 点 。 
(2) 依次 先 根 遍 历 根 的 各 个 子 树 。 


2. 后 根 遍 历 (与 对 应 的 二 叉 树 的 中 根 遍 历 序列 一 致 ) 


若 树 非 空 , 则 : 
(1) 依次 后 根 遍历 根 的 各 个 子 树 。 
(2) 访问 根 结 点 。 


3. 层次 遍历 


(1) 若 树 非 空 ,访问 根 结 点 。 

(2) 车 第 1~i(i 三 1) 层 结 点 已 被 访问 , 且 第 i 十 1 层 结 点 尚未 访问 , 则 从 左 到 右 依 次 访 
问 第 ;十 1 层 。 

显然 , 按 层次 遍历 所 得 的 结 点 访问 序列 中 ,各 结 点 的 序号 与 按 层 编号 所 得 的 编号 一 致 。 

例如 ,对 图 5. 23 所 示 树 来 说 : 

先 根 遍 历 结 点 序列 为 A.B,D,E,H,I,J,C,F,G; 

后 根 遍历 结 点 序列 为 D,H,1,J,E,B,F.G,C,A; 

层次 遍历 结 点 序列 为 A,B,C,D,E,F,G,H,1,J。 


图 5.23 一 般 树 示例 
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6.6 哈 夫 曼 树 及 其 应 用 


哈 夫 曼 (Huffman) 树 又 称 最 优 二 叉 树 ,是 一 种 带 权 路 径 长 度 最 短 的 树 , 有 着 广泛 的 应 
用 。 本 节 先 讨论 哈 夫 曼 树 的 概念 ,然后 讨论 它 的 应 用 : 最 佳 判 断 过 程 和 哈 夫 曼 编码 。 


5.6.1 哈 夫 曼 树 
1. 树 的 路 径 长 度 和 带 权 路 径 长 度 


结 点 间 的 路 径 长 度 : 从 树 中 一 个 结 点 到 另 一 个 结 点 之 间 的 分 支 构成 这 两 个 结 点 之 间 的 
路 径 ,路 径 上 的 分 支 数目 称 为 这 两 个 结 点 之 间 的 路 径 长 度 。 

树 的 路 径 长 度 : 从 树 根 到 每 个 结 点 的 路 径 长 度 之 和 。 这 种 路 径 长 度 最 短 的 树 是 前 面 定 
义 的 完全 二 叉 树 。 

在 许多 应 用 中 ,常常 将 树 中 结 点 赋予 一 个 有 某 种 意义 的 实数 , 称 为 该 结 点 的 权 。 

结 点 的 带 权 路 径 长 度 为 : 从 该 结 点 到 树 根 之 间 的 路 径 长 度 与 结 点 上 权 的 乘积 。 

树 的 带 权 路 径 长 度 为 : 树 中 所 有 叶子 结 点 的 带 权 路 径 长 度 之 和 ,通常 记 作 

WPL=WLi + WL + Wt e+ WL+-=+ WL 


= Sw 
其 中 ,n 为 二 叉 树 的 叶子 结 点 的 个 数 ,W; 为 第 i 个 叶子 结 点 的 权 值 ,L; 为 从 根 结 点 到 第 i 个 
叶子 结 点 的 路 径 长 度 。 
例如 ,图 5.24 中 的 三 棵 二 叉 树 ,都 有 4 个 叶子 结 点 a,b,c,d, 权 值 分 别 为 7,5,2,4, 它 们 
的 带 权 路 径 长 度 分 别 为 
WPL=7X2+5X2+2X2+4X2=36 
WPL=7X3+5X3+2X1+4X2=46 
WPL=7X1+5X2+2X3+4X3=35 


(a) WPL 为 36 的 二 又 树 (b) WPL 为 46 的 二 叉 树 (c) WPL 为 35 的 二 叉 树 
图 5.24 具有 不 同 带 权 路 径 的 二 叉 树 


2. 哈 夫 曼 树 和 哈 夫 曼 算 法 
假设 有 nn 个 权 值 Wi,W,，,…,W,, 试 构成 一 棵 有 7 个 叶子 结 点 的 二 叉 树 ,每 个 叶子 结 点 


第 5 章 树 


权 值 为 W;, 则 其 中 带 权 路 径 长 度 WPL 最 小 的 二 叉 树 称 作 哈 夫 曼 树 (或 最 优 二 又 树 ) 。 

在 图 5. 24(c) 中 的 树 的 WPL 最 小 。 可 以 验证 , 它 恰 为 哈 夫 曼 树 , 即 其 带 权 路 径 长 度 在 
所 有 权 值 为 7,5,2,4 的 4 个 叶子 结 点 的 二 叉 树 中 最 小 。 

怎样 根据 个 权 值 W, ,W,,…,W, 构造 哈 夫 曼 树 呢 ? 哈 夫 曼 在 1952 年 提出 了 一 种 算 
法 ,很 好 地 解决 了 这 个 问题 。 该 算法 被 称 为 哈 夫 曼 算法 , 简 述 如 下 。 

(1) 根据 给 定 的 个 权 值 Wi ,Ws，…,W, ,构成 n 棵 二 叉 树 的 集合 =={T) ,TT,,，…， 
T,}, 其 中 每 棵 二 叉 树 T; 中 只 有 一 个 权 为 W; 的 根 结 点 ,其 左 、 右 子 树 均 为 空 。 

(2) 在 下 中 任 选 两 棵 根 结 点 的 权 值 最 小 的 树 作为 左 、 右 子 树 ,构成 一 棵 新 的 二 叉 树 , 且 
置 新 的 二 叉 树 的 根 结 点 的 权 值 为 其 左 、 右 子 树 上 根 结 点 的 权 值 之 和 。 

(3) 从 下 中 删除 这 两 棵 树 ,同时 将 新 得 到 的 二 又 树 加 入 到 下 中 。 

(4) 重复 (2) 和 (3) 步 ,直到 下 中 只 含 一 棵 树 为 止 。 这 棵 树 便 是 哈 夫 曼 树 。 

例如 有 4 个 叶子 结 点 ab,c,d, 权 值 分 别 为 6,5,3,4, 其 哈 夫 曼 树 的 构造 过 程 如 图 5. 25 
所 示 。 
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(a) 哈 夫 曼 树 的 初始 状况 (b) 哈 夫 曼 树 构 造 的 第 一 步 
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(©) 哈 夫 曼 树 构造 的 第 二 步 (d) 哈 夫 曼 树 构造 的 结 
图 5.25 哈 夫 曼 树 的 构造 过 程 


下 面 讨论 哈 夫 曼 树 的 存储 结构 及 哈 夫 曼 算法 的 实现 。 

由 哈 夫 曼 算 法 可 知 ,初始 森林 中 共有 7 棵 二 又 树 ,每 棵 树 中 都 仅 有 一 个 孤立 的 结 点 , 它 
们 既是 根 , 又 是 叶子 。 算 法 的 第 (2) 步 是 : 将 当前 森林 中 的 两 棵 根 结 点 权 值 最 小 的 二 叉 树 ， 
合并 成 一 棵 新 二 叉 树 。 每 合并 一 次 ,森林 中 就 减少 一 棵 树 。 显 然 , 要 进行 2 一 1 次 合并 , 才 
能 使 森林 中 的 二 叉 树 的 数目 由 棵 减少 到 剩 下 一 棵 最 终 的 哈 夫 曼 树 。 并 且 ,每 次 合并 都 要 
产生 一 个 新 结 点 ,合并 n 一 1 次 共产 生 n 一 1 个 新 结 点 ,显然 它们 都 是 具有 两 个 孩子 的 分 支 
结 点 。 由 此 可 知 , 最 终 求 得 的 哈 夫 曼 树 中 共有 2n 一 1 个 结 点 ,其 中 半 个 叶子 结 点 是 初始 森 
林 中 的 n 个 孤立 结 点 。 显 然 , 喻 夫 曼 树 中 没有 度 为 1 的 分 支 结 点 ,这 类 树 常 称 为 严格 的 二 叉 
树 。 实 际 上 ,所 有 具有 个 叶子 结 点 的 严格 二 叉 树 都 恰 有 2n 一 1 个 结 点 。 可 以 用 一 个 大 小 
为 2 一 1 的 向 量 来 存储 哈 夫 曼 树 中 的 结 点 ,其 存储 结构 为 : 

井 define n 叶子 数 

井 definem2x*n-1 // 树 中 结 点 总 数 


typedef struct 
{ // 结 点 类 型 
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int weight; // 权 值 

int plink, 11ink, rlink; // 双 亲 及 左右 孩子 指针 (静态 指针 ) 
}node; 
node tree[m+1]; // 下 标 取 值 从 1 到 m,0 作为 空 指针 标志 


在 上 述 存 储 结构 上 实现 的 哈 夫 曼 树 算法 可 大 致 描述 为 : 

(1) 初始 化 。 将 tree[L1..m] 中 每 个 结 点 里 的 三 个 指针 均 置 为 空 ( 即 置 为 0) 。 

(2) 输入 。 读 入 nn 个 叶子 的 权 值 ,分 别 保存 于 tree 的 前 个 分 量 中 ,它们 是 初始 森林 中 
nn 个 孤立 的 根 结 点 上 的 权 值 。 

(3) 合并 。 

对 森林 中 的 树 共 进 行 n 一 1 次 合并 ,所 产生 的 新 结 点 依次 放 入 tree 的 第 i 个 分 量 中 
(n 二 i<m)。 每 次 合并 分 两 步 : 

@ 在 当前 森林 tree[1..i 一 1] 的 所 有 结 点 中 ,选取 权 值 最 小 和 次 小 的 两 个 根 结 点 
tree[x1] 和 tree[xs] 作 为 合并 对 象 ,这 里 1<x1 ,zs 入 ;一 1。 

@ 将 根 为 tree[x1] 和 tree[Lz?] 的 两 棵 树 作为 左右 子 树 合并 成 为 一 棵 新 的 树 ,新 树 的 根 
是 新 结 点 tree[i]。 因 此 ,应 将 treeLzi] 和 tree[ zs] 的 双亲 plink 置 为 了 ,将 tree[z] 的 llink 
和 rlink 分 别 置 为 zx; 和 zs， 而 新 结 点 tree[i] 的 权 值 应 置 为 treeLzi] 和 tree[z?] 的 权 值 之 
和 。 注 意 ,合并 后 treeLzi] 和 tree[zs] 在 当前 森林 中 已 不 再 是 根 , 因 为 它们 的 双亲 指针 均 已 
指向 了 tree[Li], 所 以 下 一 次 合并 时 不 会 被 选 为 合并 对 象 。 

哈 夫 曼 算法 实现 如 下 。 

算法 5.12 哈 夫 曼 树 的 构造 。 


void sethuftree(node tree[ ]) 


{ 
int al 


inithafumantree(tree); // 将 tree 初始 化 
inputweight (tree); // 输 入 叶子 权 值 
for(i=n+1;i<=m;it+) // 共 进行 n- 1 次 合并 ,新 结 点 依次 存 于 tree[i] 中 


{ 
select(i—1,g&x],&x2); 
// 在 tree[1..i-1] 中 选择 两 个 权 值 最 小 的 根 结 点 ,其 序号 分 别 为 xl 和 x2 
tree[x1].plink= i; 
tree[x2].plink= i; 
tree[ i]. 1link = xl; // 权 值 最 小 的 根 结 点 是 新 结 点 的 左 孩 子 
tree[ i]. rlink = x2; // 权 值 次 小 的 根 结 点 是 新 结 点 的 右 孩 子 
tree[ i].weight = tree[xl]. weight + tree[ x2]. weight; 


. 


5.6.2 哈 夫 曼 树 的 应 用 
1. 最 佳 判定 算法 


在 解决 某 些 判定 问题 时 ,利用 哈 夫 曼 树 可 以 得 到 最 佳 判定 算法 。 例 如 ,要 编制 一 个 将 百 
分 制 转换 成 五 级 分 制 的 程序 ,只 需 利用 条 件 语句 便 可 完成 。 如 : 


if(a<60) 
b= "bad"; 
else if(a<70) 
b= "pass"; 
else if(a< 80) 
b= "general"; 
else if(a<90) 
b= "good"; 
else b= "excellent"; 


这 个 判定 过 程 可 用 图 5. 26(a) 的 判定 树 来 表示 。 如 果 上 述 程序 需 反复 使 用 ,而 且 每 次 
的 输入 量 很 大 , 则 应 考虑 上 述 程序 的 执行 效率 问题 , 即 其 操作 所 需 时 间 。 因 为 在 实际 问题 处 
理 中 ,学 生 的 成 绩 在 五 个 等 级 上 的 分 布 是 不 均匀 的 。 假 设 其 分 布 如 表 5. 1 所 示 , 显 然 ,80% 
以 上 的 数据 需 进 行 3 次 或 3 次 上 的 比较 才能 得 出 结果 。 

表 5.1 学 生成 绩 分 布 表 


分 数 0 一 59 60 一 69 70 一 79 80 一 89 90 一 100 


比例 数 0.05 0.15 0. 40 0. 30 0. 10 


假定 以 5、15、40、30、10 为 权 值 构成 一 棵 有 五 个 叶子 结 点 的 哈 夫 曼 树 , 则 可 得 到 如 图 5. 26(b) 
所 示 的 判定 过 程 , 它 可 使 大 部 分 数据 经 过 较 少 的 比较 次 数 即 得 到 结果 。 但 由 于 每 个 判定 框 
都 有 两 次 比较 ,将 这 两 次 比较 分 开 , 即 得 到 如 图 5. 26(c) 所 示 的 判定 树 , 按 此 判定 树 写 出 相 
应 的 程序 。 假 设 现 有 10 000 个 输入 数据 , 按 图 5. 26(a) 所 示 的 判定 过 程 操作 总 共 需 进行 
31 500 次 比较 ; 而 按 图 5. 26(c) 所 示 的 判定 过 程 进行 操作 , 则 总 共 需 进行 22 000 次 比较 。 
显然 ,优化 的 判定 过 程 极 大 地 提高 了 效率 。 


60<=a<702 
N 


Y 


(0) 优化 的 判定 树 
图 5.26 转换 五 级 分 制 的 判定 过 程 
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2. 哈 夫 曼 编码 


电报 是 进行 快速 远 距 离 的 通信 手段 之 一 。 发 送 电 报时 需 将 传送 的 文字 转换 成 二 进 制 的 
字符 组 成 的 字符 串 。 例 如 ,假设 需 传送 的 电文 为 'ABACCDA', 它 只 有 四 种 字符 ,只 需 两 位 二 
进 制 字符 串 便 可 分 辨 假设 A、B、C.D 的 编码 分 别 为 00,01,10 和 11, 则 上 述 七 个 字符 的 电 
文 编码 为 '00010010101100', 总 长 14 位 ,对 方 接收 时 可 按 二 位 一 分 进行 译 码 。 

当然 ,在 传送 电文 时 ,希望 总 长 尽 可 能 的 短 。 如 果 对 每 个 字符 设计 长 度 不 等 的 编码 , 且 
让 电文 中 出 现 次 数 较 多 的 字符 采用 尽 可 能 短 的 编码 , 则 传送 电文 的 总 长 度 便 可 减 短 。 如 果 
设计 A.B、C、D 的 编码 分 别 为 0.00.1 和 01, 则 上 述 电文 被 编码 成 长 度 为 9 的 字符 串 
'000011010'。 但 是 ,这 样 的 电文 无 法 翻译 。 例 如 ,传送 过 去 的 字符 串 中 前 四 个 字符 的 子 串 
'0000' 就 可 有 多 种 译 法 ,或 是 'AAAA' 或 是 'ABAA' 等 。 产 生 该 问题 的 原因 是 A 的 编码 与 BB 
的 编码 的 开始 部 分 (前 级 ) 相 同 。 因 此 ,车 对 某 字符 集 进行 不 等 长 编码 ,就 要 求 字 符 集中 任 一 
字符 的 编码 都 不 是 其 他 字符 编码 的 前 缀 ,这 种 编码 称 为 前 级 编码 。 显 然 , 等 长 编码 也 是 前 缀 
编码 。 

问题 是 应 该 怎样 设计 前 级 编码 ?什么 样 的 前 级 编码 才能 使 得 电文 的 总 长 最 短 ” 可 以 利 
用 哈 夫 曼 树 设计 二 进 制 的 前 级 编码 来 解决 此 问题 。 

假设 有 一 棵 如 图 5. 27 所 示 的 二 叉 树 ,其 四 个 叶子 结 点 
分 别 表示 A、B、C、D 四 个 字符 , 且 约 定 左 分 支 表示 字符 '0'， 


右 分 支 表 示 字 符 '1', 则 可 将 从 根 结 点 到 时 子 结 点 的 路 径 上 AN 
分 支 字符 组 成 的 字符 串 作为 该 叶子 结 点 字符 的 编码 。 不 难 es 


理解 ,如 此 得 到 的 必 为 二 进 制 前 级 编码 ,如 图 5. 27 所 示 ， 
A、B、C\D 的 二 进 制 前 级 编码 分 别 为 0、10、110 和 111。 

那么 如 何 得 到 使 电文 总 长 最 短 的 二 进 制 前 级 编码 呢 ? 
假设 每 种 字符 在 电文 中 出 现 的 次 数 为 W; ,其 编码 长 度 为 
L;, 电 文中 只 及 种 字符 , 则 电文 总 长 为 克 ; 革 ;十 砚 L。 十 … 十 瑟 ;十 … 十 见 江 ,。 对 应 到 二 
叉 树 上 , 若 置 W; 为 叶子 结 点 的 权 , 志 ; 恰 为 从 根 到 叶子 的 路 径 长 度 。 则 Wi 工 i 十 WL; 十 … 十 
WiL; 十 W,L， 恰 为 二 又 树 的 带 权 路 径 长 度 。 由 此 可 见 , 设 计 电文 总 长 最 短 的 二 进 制 前 级 编 
码 , 也 就 是 以 种 字符 出 现 的 频率 作 叶子 结 点 的 权 , 设 计 一 个 哈 夫 曼 树 的 问题 ,由 此 得 到 的 
二 进 制 前 级 编码 便 称 为 哈 夫 曼 编码 。 

在 求 出 了 给 定 字符 集 的 哈 夫 曼 树 后 , 求 该 字符 集 的 哈 夫 曼 编码 的 具体 过 程 是 : 依次 以 
叶子 tree[i](1 二 i 坟 n) 为 出 发 点 ,向 上 回溯 至 根 为 止 。 上 漳 时 走 左 分 支 则 生成 编码 0, 走 右 
分 支 则 生成 编码 1。 显 然 ,这 样 生成 的 编码 与 要 求 的 编码 反 序 。 因 此 ,将 生成 的 代码 从 后 往 
前 依次 存放 在 一 个 临时 向 量 中 ,并 设 一 个 指针 start 指示 编码 在 该 向 量 中 的 起 始 位 置 。 当 某 
字符 编码 完成 时 ,从 临时 向 量 的 start 处 将 编码 复制 到 该 字符 相应 的 位 串 bits 中 即 可 。 因 为 字 
符 集 大 小 为 n, 故 变 长 编码 的 长 度 不 会 超过 ,加 上 一 个 结束 符 A0 ',bits 的 大 小 应 为 n 十 1。 

字符 集 编码 的 存储 结构 及 其 算法 描述 如 算法 5. 13。 

算法 5.13 哈 夫 曼 编 码 。 


typedef struct 
{ // 结 点 类 型 


D:111 


图 5.27 前 组 编码 示例 


int weight; // 权 值 
int plink, 11ink,rlink; // 双 亲 及 左右 孩子 指针 (静态 指针 ) 
}node; 


typedef struct 
{ 


int start; // 存 放 起 始 位 置 
char bits[n+1]; // 存 放 编码 位 串 
}codetype; 


typedef struct 
{ 


char symbol; // 存 储 字符 
codetype code; // 存 储 编码 
}element; 


element table[n+1]; 
void huffcode(node tree[ ],element table[])  ”// 根 据 哈 夫 曼 树 tree 求 哈 夫 曼 编码 表 table 
{ 


int i,s,£; //s 和 分 别 指示 tree 中 孩子 和 双亲 的 位 置 
codetype c; // 临 时 存放 编码 
for(i=1;i<=n;it+) // 依 次 求 叶 子 tree[ i] 的 编码 
{ 
c.start=n+1; 
s=i; // 从 叶子 tree[i] 开 始 上 测 
while(f = tree[ s]. plink) // 直 至 上 漳 到 树 根 为 止 


{ 
c.bits[ -- c. start] = (s== tree[f].1link)?'0':'1'; 
s=f£; 
f= tree[s].plink; 
}; 
table[i].code=c; // 临 时 编码 复制 到 最 终 位 置 


} 


例 5.1 已 知 某 系统 在 通信 网 络 中 只 可 能 出 现 八 种 字符 
(A、B、.C.D、E、F、G、H), 其 频率 分 别 为 0.05、0. 29、0. 07、 
0.08、0. 14、0.23、0.03、0.11, 试 设计 哈 夫 曼 编码 。 

设 权 W=(5,29,7,8,14,23,3,11) ,字符 数目 = 二 8, 按 昭 
哈 夫 曼 算法 可 构造 一 棵 哈 夫 曼 树 ,如 图 5. 28 所 示 , 根 据 哈 夫 
曼 树 得 到 的 哈 夫 曼 编 码 如 图 5. 29 所 示 。 

有 了 字符 集 的 哈 夫 曼 编码 表 之 后 ,对 数据 文件 的 编码 过 
程 是 : 依次 读 入 文件 中 的 字符 C, 在 哈 夫 曼 编 码 表 table 中 找 
到 此 字符 , 若 table[ij. symbol 一 一 C, 则 将 字符 C 转换 为 图 5.28 例 5.1 的 哈 夫 曼 树 
table[ij. code 中 存放 的 编码 串 。 

对 压缩 后 的 数据 文件 进行 解码 则 必须 借助 于 哈 夫 曼 树 tree。 其 过 程 是 : 依次 读 入 文件 
的 二 进 制 码 ,从 哈 夫 曼 树 的 根 结 点 出 发 ,车 当前 读 入 0, 则 走向 左 孩 子 ,否则 走向 右 孩子 ,一 
且 达 到 某 一 叶子 tree[ 记 时 便 译 出 相应 的 字符 table[ 记 . symbol, 然 后 重新 从 根 出 发 继续 译 
码 , 直 至 文件 结束 。 
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Weight Parent Leh Rch 
5 0 0 0 
2 29 0 0 0 
3 7 0 0 0 
4 8 0 0 0 
5 14 0 0 0 
6 23 0 0 0 
7 3 0 0 0 
8 11 0 0 0 
9 - 0 0 0 
10 - 0 0 0 
11 - 0 0 0 
12 - 0 0 0 
13 - 0 0 0 
14 - 0 0 0 
15 = 0 0 0 
(a) 哈 夫 曼 树 初始 化 
Weight Parent Lch Reh 
1 5 9 0 0 
2 29 14 0 0 
2 7 10 0 0 
4 8 10 0 0 
各 14 12 0 0 
6 23 13 0 0 
7 3 多 0 0 
8 11 11 0 0 
9 8 11 1 学 
10 15 12 3 4 
11 19 13 8 9 
12 29 14 5 10 
13 42 15 6 11 
14 58 15 2 12 
15 100 0 13 14 
(b) 构造 的 哈 夫 曼 树 
0 1 及 3 4 5 6 7 Start 
1 1 1 0 4 
2 1 0 6 
3 1 1 1 0 4 
4 1 1 1 1 4 
5 L 1 0 5 
6 0 0 6 
7 0 1 1 4 
8 0 1 0 和 


(©) 哈 夫 曼 树 对 应 的 哈 夫 曼 编码 
图 5.29 哈 夫 曼 编码 


67 C++ 中 的 树 


5.7.1 C++ 中 的 二 叉 树 结 点 类 


例 5. 2 是 二 叉 链表 结 点 的 C++ 类 BTNode, 每 个 结 点 包含 三 个 数据 成 员 和 三 个 构造 
函数 。 
例 5.2 二 叉 树 结 点 类 。 


template < class T> 
struct BTNode 


BTNode( ){ 1Child = rChild = NULL;} 

//1Child 和 rChild 分 别 是 指向 左 孩 子 和 右 孩 子 的 指针 
BTNode( const T& x) 

element = x; 1Child= rChild = NULL; 

BTNode( const T& x, BTNode < T>* 1,BTNode <T>* r) 


element = x; lChild= 1; rChild=r; 


T element; 
BTNode <T> * 1Child, * rChild; 


; 


5.7.2 C++ 中 的 二 叉 树 类 


例 5. 3 定义 了 由 二 又 链表 表示 的 二 叉 树 类 BinaryTree。 类 BinaryTree 包含 唯一 的 数 
据 成 员 , 它 指向 一 个 二 叉 链 表 根 结 点 的 指针 root。 请 务必 注意 区 分 二 叉 树 对 象 和 由 二 又 树 
对 象 的 根 指针 root 所 指示 的 二 叉 树 ( 即 二 又 链表 ) 。 一 个 二 叉 树 对 象 的 根 指针 root 所 指示 
的 二 又 树 , 是 该 二 又 树 对 象 所 包含 的 一 棵 二 叉 树 。 在 不 引起 混淆 的 情况 下 ,将 二 又 树 对 象 和 
它 所 包含 的 二 叉 树 统称 为 二 又 树 。 例 5. 4 是 二 叉 树 类 BinaryTree 的 部 分 运算 。 例 5.5 是 
二 叉 树 类 BinaryTree 的 递归 方式 先 根 遍历 二 叉 树 运算 。 

例 5.3 二 叉 树 类 。 


template < class T> 
class BinaryTree 
{ 
public: 
BinaryTree( ){root = NULL;} 
~BinaryTree( ){Clear();} 
bool IsEmpty()const; 
void Clear( ); 
bool Root(T &x)const; 
void MakeTree(const T &e ,BinaryTree <T> &left, BinaryTree <T> & right); 
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// 构 造 二 叉 树 
void BreakTree(T &e ,BinaryTree <T> &left, BinaryTree <T> & right); 
void PreOrder(void ( * Visit) (TE& x)); // 递 归 方式 先 根 遍历 二 叉 树 
void InOrder(void ( * Visit)(T& x)); 
void PostOrder(void ( * Visit)(T& x)); 
protected: 
BTNode <T>* root; 
private: 
void Clear(BTNode <T>* t); 
void PreOrder(void ( * Visit)(T& x),BTNode <T>*t); 
void InOrder(void ( * Visit)(T& x), BTNode <T>* t+); 
void PostOrder(void ( * Visit)(T& x),BTNode <T>*t); 
}; 


例 5.4 部 分 二 又 树 运算 。 


template < class T> 
bool BinaryTree<T>: :Root(T &x)const 
下 
if(root){ 
X= root— > element; return true; 
} 
else return false; 
} 
template <class T> 
void BinaryTree < T>: :MakeTree(const T &x ,BinaryTree <T> &left, BinaryTree < T> & right) 
ed 
if(root| |&left == &right) return; 
root = new BTNode < T >(x, left. root, right. root); 
left. root = right. root = NULL; 
} 
template <class T> 
void BinaryTree <T>::BreakTree(T &x, BinaryTree <T> &left, BinaryTree <T> & right) 
{ 
if (!root||&left == &right| |left. root| |right. root)return; 
X= root — > element; 
left. root = root ~ > 1Child;right. root = root 一 > rChild; 
delete root; root = NULL; 


例 5.5 递归 方式 先 根 遍历 二 又 树 。 


template < class T> 
void BinaryTree <T>::PreOrder(void ( * Visit)(T& x)) 
{ 
PreOrder(Visit, root); 
} 
template <class T> 
void BinaryTree < T>::PreOrder(void ( * Visit)(T& x), BTNode <T>* 七 ) 
* 
if (t){ 
Visit(t 一 > element); // 递 归 遍 历 根 结 点 


PreOrder(Visit,t—> 1Child); // 递 归 遍 历 左 子 树 
PreOrder(Visit,t 上 一 > rChild); // 递 归 遍 历 右 子 树 


5.7.3 C++ 中 二 叉 树 的 非 递归 遍历 


二 又 树 的 遍历 可 分 为 递归 方式 和 非 递归 方式 。 用 C++ 来 描述 二 又 树 的 非 递归 遍历 如 
例 5.6 所 示 的 遍历 器 类 BIterator, 由 它 可 派生 三 个 具体 实施 先 根 、 中 根 和 后 根 遍历 的 遍历 
器 类 , 例 5.7 是 非 递 归 方 式 的 中 根 遍历 器 类 。 

例 5.6 遍历 器 类 。 


template <class T> 
class BIterator 
{ 
public: 
virtual Tx* GoFirst(const BinaryTree<T>& bt)=0; 
virtual Tx* Next (void) = 0; 
Virtual void Traverse(void ( * Visit)(T& x), const BinaryTree <T> & bt); 
protected: 
BTNode <T>* r, *current; 

}; 
template <class T> 
void BIterator <T>::Traverse(void ( * Visit)(T& x), const BinaryTree <T> & bt) 
{ 

Tx p=GoFirst(bt); 

while (p){ 

Visit( * p);p= Next(); 

} 

} 


例 5.7 中 根 遍历 器 类 。 


template <class T> 
class IInOrder:public BIterator <T> 


{ 

public: 
IInOrder(BinaryTree <T> & bt, int mSize) 
{ 


r=bt.root; current = NULL; 
s= new SeqStack <BTNode <T>* >(mSize); 
} 
Tx GoFirst(const BinaryTree <T> & bt); 
Tx Next (void); 
private: 
SeqStack < BINode <T>*> *s; 
}; 
template < class T> 
Tx IInOrder <T>::GoFirst(const BinaryTree <T> &bt) 
{ 
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current = bt. root; 
if (!current) return NULL; 
while (current 一 > 1Child!= NULL){ 
s—> Push(current); current = current 一 > 1Child; 
} 
return &current 一 > element; 
} 
template <class T> 
Tx IInOrder <T>::Next(void) 
{ 
BTNode <T>* p; 
if (current — > rChild!= NULL){ 
p= current —>rChild; 
while (p 一 > 1Child!= NULL){ 
s->Push(p);p=p-> 1Child; 
Jj 


current = p; 
} 
else if (!s—> IsEmpty()){ 
s—->Top(current); s -> Pop(); 
else{ 
current = NULL; return NULL; 
J 


return &current — > element; 


} 


回 题 5 


1. 已 知 一 棵 树 边 的 集合 为 (I,M) (I,N) CE,D) 、(B,E)B,.D) CA,B)G,J)、(CG， 
K) C,G) CC,F) CT,L) C,T) CA,C) , 夯 出 这 棵 树 ,并 回答 下 列 问 题 ， 

(1) 哪个 是 根 结 点 ? 

(2) 哪些 是 叶子 结 点 ? 

(3) 哪个 是 结 点 G 的 双亲 ? 

(4) 哪些 是 结 点 G 的 祖先 ? 

(5) 哪些 是 结 点 G 的 孩子 ? 

(6) 哪些 是 结 点 下 的 子孙 ? 

(7) 哪些 是 结 点 下 的 兄弟 ? 哪些 是 结 点 下 的 兄弟 ? 

(8) 结 点 B 和 N 的 层次 号 分 别 是 什么 ? 

(9) 树 的 深度 是 多 少 ? 

(10) 以 结 点 C 为 根 的 子 树 的 深度 是 多 少 ? 

2. 一 棵 度 为 2 的 树 与 一 棵 二 又 树 有 何 区 别 ? 

3. 试 分 别 画 出 具有 3 个 结 点 的 树 和 3 个 结 点 的 二 叉 树 的 所 有 不 同形 态 。 

4. 一 棵 深度 为 N 的 满 K 叉 树 有 如 下 性 质 : 第 N 层 上 的 结 点 都 是 叶子 结 点 ,其 余 各 层 


上 每 个 结 点 都 有 K 棵 非 空子 树 。 如 果 按 层次 顺序 从 1 开始 对 全 部 结 点 编号 , 问 : 

(1) 各 层 的 结 点 数目 是 多 少 ? 

(2) 编号 为 n 的 结 点 的 父 结 点 ( 若 存 在 ) 的 编号 是 多 少 ? 

(3) 编号 为 n 的 结 点 的 第 i 个 儿子 (车 存在 ) 的 编号 是 多 少 ? 

(4) 编号 为 n 的 结 点 有 右 兄弟 的 条 件 是 什么 ?其 右 兄 弟 的 编号 是 多 少 ? 

5. 已 知 一 棵 度 为 m 的 树 中 有 ni 个 度 为 1 的 结 点 ,zs 个 度 为 2 的 结 点 ,…,n, 个 度 为 m 
的 结 点 , 问 该 树 中 有 多 少 个 叶子 结 点 ? 

6. 试 列 出 图 5. 30 所 示 的 二 叉 树 的 终端 结 点 、 非 终端 结 内 
点 以 及 每 个 结 点 的 层次 。 

7. 对 于 图 5. 30 所 示 的 二 又 树 ,分别 列 出 先 根 遍历 .中 根 (8) fc) 
人 遍历、 后 根 遍历 的 结 点 序列 。 

8. 在 二 又 树 的 顺序 存储 结构 中 ,实际 上 隐 含 着 双亲 的 《D] (各 
信息 ,因此 可 和 三 叉 链表 对 应 。 假 设 每 个 指针 域 占 4 字 节 的 
存储 空间 ,每 个 信息 占 & 字 节 的 存储 空间 。 试 问 对 于 一 棵 有 (© 四 
n 个 结 点 的 二 又 树 , 且 在 顺序 存储 结构 中 最 后 一 个 结 点 的 下 图 5. 30 二 叉 树 示例 
标 为 m, 在 什么 条 件 下 顺序 存储 结构 比 二 叉 链 表 更 节省 
空间 ? 

9. 假定 用 两 个 一 维 数组 L(1 : n) 和 R(1 : n) 作 为 有 nn 个 结 点 的 二 叉 树 的 存储 结构 ， 
L(i) 和 R(i) 分 别 指示 结 点 i 的 左 孩 子 和 右 孩 子 ,0 表示 空 。 

(1) 试 写 一 个 算法 判别 结 点 u 是 否 为 结 点 v 的 子孙 ; 

(2) 先 由 LL(1 :nn) 和 R(1 :nn) 建 立 一 维 数组 T( :nn), 使 TT 中 第 i(i 二 1,2,…,n) 个 分 
量 指示 结 点 i 的 双亲 ,然后 编写 判别 结 点 u 是 否 为 结 点 v 的 子孙 的 算法 。 

10. 假设 n 和 wm 为 二 叉 树 中 的 两 结 点 ,用 1、0、@( 分 别 表示 肯定 \ 恰 恰 相 反 和 不 一 定 ) 填 
写 表 到 2。 


表 5.2 第 10 题 表 
先 根 遍历 时 中 根 遍历 时 后 根 遍 历时 
已 知 nn 在 m 前 ? nn 在 m 前 ? nn 在 m 前 ? 
n 在 m 的 左 方 
nn 在 m 的 右 方 
n 是 m 的 祖先 
nn 是 m 的 子孙 


注 : @ 如 果 离 和 最 近 的 共同 祖先 p 存在 , 且 @a 在 p 的 左 子 树 中 心 在 p 的 右 子 树 中 , 则 称 a 在 5 的 左 方 ( 即 6 
在 a 的 右 方 )。 


11. 假设 以 二 叉 链 表 作 为 存储 结构 , 试 分 别 写 出 先 根 遍 历 和 后 根 遍 历 的 非 递 归 算 法 ,可 
直接 利用 栈 的 基本 运算 。 

12. 假设 在 二 又 链表 中 增设 两 个 域 : 双亲 域 (parent) 以 指示 其 双亲 结 点 ; 标志 域 
(mark) 为 0..2, 以 区 分 在 遍历 过 程 中 到 达 该 结 点 时 应 该 继续 向 左 或 向 右 或 访问 该 结 点 。 试 
以 此 存储 结构 编写 不 用 栈 的 后 根 遍 历 的 算法 。 

13. 试 编写 算法 在 一 棵 以 二 又 链表 存储 的 二 叉 树 中 求 这 样 的 结 点 : 它 在 先 根 序列 中 第 
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K 个 位 置 。 

14. 试 以 二 又 链表 作为 存储 结构 ,编写 计算 二 又 树 中 叶子 结 点 数目 的 递归 算法 。 

15. 以 二 又 链表 作为 存储 结构 , 编 定 算法 将 二 又 树 中 所 有 结 点 的 左右 子 树 相互 交换 。 

16. 已 知 一 棵 二 叉 树 以 二 又 链表 作为 存储 结构 ,编写 完成 下 列 操作 的 算法 : 对 于 树 中 
每 个 元 素 值 为 x 的 结 点 , 删 去 以 它 为 根 的 子 树 ,并 释放 相应 的 空间 。 

17. 已 知 一 棵 以 二 又 链表 作 存 储 结构 的 二 又 树 , 试 编写 复制 这 棵 二 又 树 的 非 递归 算法 。 

18. 已 知 一 棵 以 二 叉 链 表 为 存储 结构 的 二 叉 树 , 试 编写 层次 顺序 (同一 层 自 左 向 右 ) 遍 
历 二 叉 树 的 算法 。 

19. 试 以 二 叉 链 表 作 为 存储 结构 ,编写 算法 判别 给 定 二 叉 树 是 否 为 完全 二 叉 树 。 

20. 已 知 一 棵 完全 二 又 树 存在 于 顺序 存储 结构 A(1 : max) 中 ,AL1 :nj 含 结 点 值 。 试 
编写 算法 由 此 顺序 结 点 建立 该 二 叉 树 的 二 叉 链表 。 

21. 编写 一 个 算法 ,输出 以 二 又 树 表示 的 算术 表达 式 , 若 该 表达 式 中 含有 括号 , 则 在 输 
出 时 应 该 添上 ,已 知 二 又 树 的 存储 结构 为 二 又 链表 。 

22. 一 棵 二 又 树 的 直径 定义 为 ,从 二 叉 树 的 根 结 点 到 所 有 叶子 结 点 的 路 径 长 度 的 最 大 
值 。 假 设 以 二 又 链表 作为 存储 结构 , 试 编写 算法 求 给 定 二 叉 树 的 直径 和 其 长 度 等 于 直径 的 
一 条 路 径 ( 即 从 根 到 该 叶子 结 点 的 序列 ) 。 

23. 试 分 别 画 出 图 5. 31 中 各 二 叉 树 的 先 根 .中 根 、 后 根 的 线索 二 又 树 。 
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图 5.31 二 叉 树 示例 


24. 试 编写 一 个 算法 ,在 中 根 线索 二 又 树 中 , 结 点 p 之 下 插入 一 棵 以 结 点 x 为 根 ,只 有 
左 子 树 的 中 根 全 线索 化 二 又 树 ,使 zx 为 根 的 二 叉 树 成 为 p 的 左 子 树 , 若 p 原来 有 左 子 树 , 则 
令 它 为 zx 的 右 子 树 。 完 成 插入 之 后 二 叉 树 应 保持 线索 化 特性 。 

25. 已 知 一 棵 以 线索 链表 作为 存储 结构 的 中 根 线索 二 又 树 , 试 编写 在 此 二 叉 树 上 找 后 
根 线索 后 继 的 算法 。 

26. 将 图 5. 32 所 示 森 林 转 换 为 相应 的 二 又 树 ,并 按 中 根 遍 历 进 行 线索 化 : 


hi 


图 5.32 森林 示例 


27. 画 出 图 5. 31 所 示 各 二 又 树 相 应 的 森林 。 

28. 对 以 下 存储 结构 分 别 写 出 计算 树 的 深度 的 算法 。 

(1) 双亲 表示 法 ; 

(2) 孩子 链表 表示 法 ; 

(3) 孩子 兄弟 表示 法 。 

29. 假设 一 棵 二 叉 树 的 层 序 序列 为 A BCDEFG HIJ, 中 根 序列 为 DBGEHJAC 
IF。 请 画 出 该 树 。 

30. 证 明 : 树 中 结 点 x 是 结 点 wv 的 祖先 , 当 且 仅 当 在 先 根 序列 中 v 在 wv 之 前 , 且 在 后 根 
序列 中 在 v 之 后 。 

31. 证 明 : 在 结 点 数 大 于 1 的 哈 夫 曼 树 中 不 存在 度 为 1 的 结 点 。 

32. 设 有 一 组 权 WG 二 1、4、9、16、25、36、49、64、81、100, 试 画 出 其 哈 夫 曼 树 ,并 计算 带 
权 的 路 径 长 度 。 

33. 假设 用 于 通信 的 电文 仅 由 8 个 字母 组 成 ,字母 在 电文 中 出 现 的 频率 分 别 为 7、19、2、 
6、32、3、21、10, 试 为 这 8 个 字母 设计 哈 夫 曼 编码 ,使 用 0 一 7 的 二 进 制 表示 形式 是 另 一 编码 
方案 。 对 于 上 述 实例 ,比较 两 个 方案 的 优 缺 点 。 

34. 证 明 : 由 一 棵 二 叉 树 的 先 根 序列 和 中 根 序列 可 唯一 确定 这 棵 二 叉 树 。 

35. 已 知 一 棵 二 又 树 的 先 根 序列 和 中 根 序列 分 别 存在 于 两 个 一 维 数组 中 , 试 编写 算法 
建立 该 二 叉 树 的 二 又 链 表 。 
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1. 建立 一 棵 二 叉 排序 树 并 中 根 遍历 (根据 题目 完善 程序 )。 


# include "stdio. h" 

# include "malloc.h" 

struct node{ 

char data; 

struct node * lchild, * rchild; 
} bnode; 


typedef struct node * blink; 
blink add(blink bt, char ch) // 二 又 排序 树 的 插入 算法 


{ 
if(bt == NULL) 
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{ 
bt = nalloc(sizeof(bnode)); 
bt 一 > data = ch; 
bt 一 > lchild = bt 一 >Irchild = NULL; 


} 
else 
if ( ch< bt—> data) 
bt 一 > lchild = add(bt 一 > lchid, ch); 
else 
bt 一 > rchild = add(bt 一 > rchild,ch); 
return bt; 


} 


void inorder(blink bt) 
{ 


if(bt) 
{ inorder(bt—> Ws 
printf("%c", A 
inorder(bt 一 > 


} 
} 
void main() 
{ 
blink root = NULL; 
int i,n; 
Char x; 
scanf(" $c", &n); 
for(i=1;i<=n;i+t+) 
{ 
x= getchar( ); 
root = add( root, x); 
于 
inorder(root) ; 
printf("\n"); 
} 
2. 由 前 组 表达 式 建立 二 又 树 的 二 又 链表 结构 , 求 该 表达 式 对 应 的 后 级 、 中 级 表达 式 。 
3. 编写 程序 ,实现 按 层次 遍历 二 叉 树 。 
4. 建立 由 合法 的 表达 式 字 符 串 确定 的 只 含 二 元 操作 符 的 非 空 表达 式 树 ,其 存储 结构 为 
二 叉 链表 ,用 二 又 树 的 遍历 算法 求 该 中 缀 表达 式 对 应 的 后 级 、 前 缀 表达 式 。 


本 章 学 习 要 点 

(1) 熟悉 图 的 各 种 存储 结构 及 其 构造 算法 ,了 解 实际 问题 的 求解 效率 与 采用 的 存储 结 
构 和 算法 有 密切 联系 。 

(2) 熟练 掌握 图 的 两 种 搜索 路 径 的 遍历 : 遍历 的 定义 ,深度 优先 搜索 的 (递归 和 非 递归 
算法 ) 算 法 和 广度 优先 搜索 算法 。 

(3) 应 用 图 的 遍历 算法 求解 各 种 简单 路 径 问 题 。 

(4) 理解 本 章 中 讨论 的 各 种 图 的 算法 。 

图 (graph) 是 比 线性 表 和 树 更 为 复杂 的 一 种 数据 结构 。 在 线性 表 中 ,数据 元 素 之 间 呈 线 
性 关系 ,每 个 数据 元 素 只 有 一 个 直接 前 驱 和 一 个 直接 后 继 ; 在 树 形 结构 中 ,数据 元 素 之 间 有 
明显 的 层次 关系 ,同一 层 的 每 一 个 元 素 可 以 与 它 的 下 一 层 的 零 个 或 多 个 元 素 相 关 , 但 只 能 与 
上 一 层 中 的 一 个 元 素 相关 ,然而 在 图 形 结构 中 ,数据 元 素 之 间 的 关系 是 任意 的 ,每 个 数据 元 
素 都 可 以 和 任何 其 他 元 素 相关 。 

现代 科技 领域 中 ,图 的 应 用 非常 广泛 ,如 电子 线路 .通信 工程 人工 智能 、 控 制 论 等 都 广 
泛 应 用 了 图 的 理论 。 

本 章 主要 讲解 图 这 种 数据 结构 的 存储 结构 以 及 图 的 若干 种 操作 的 实现 。 


6.1 图 的 概念 与 操作 


6.1.1 图 的 定义 


图 的 形式 化 定义 为 G= 二 (V,E), 其 中 V 是 一 个 非 空 有 限 集合 , 它 的 元 素 称 为 顶点 
(vertex)。 顶 点 的 偶 对 (z+ ,y) (rEV,y EV) 称 为 边 (edge),E 是 边 的 集合 。 若 图 中 代表 一 
条 边 的 顶点 偶 对 是 有 序 的 , 记 作 (xz,y), 称 x 为 弧 
尾 (tail) , 称 > 为 弧 头 (head)。(x,y) 表 示 从 z+ 到 y 2 © C9 © 
的 一 条 弧 (arc) ,此 时 的 图 称 为 有 向 图 (digraph) 。 若 ~、 og 
图 中 代表 一 条 边 的 顶点 偶 对 (zx,y) 是 无 序 的 , 则 称 一 一 (3) oN 
于 为 知 则 国富 是 国志 (@) 有 向 图 G (b) 无 向 图 G3 
条 边 。 例 如 图 6.1(a) 中 G, 是 有 向 图 .图 6. 1(b) 中 el 疝 珊 训 曾 
Gs 是 无 向 图 。 
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Gi 一 (VE,) 其 中 : Vi 二 {viyv2 9v3904} ,已 ;一 {(olyos), (usyol)， (uiyos)， (olyot)}。 

G;=(V;,E,) 其 中 : V,={viyv2sv03504505} Es ={(viv02) (V1504) (V2 v03), (vs, 
Vs) vss04) (Vs 505)}。 

如 果 用 nn 表示 图 中 顶点 数目 ,用 e 表示 边 和 弧 的 数目 ,不 考虑 顶点 到 其 自身 的 弧 或 边 ， 
即 若 (v， ,vj;) EE, 则 vw, !=v) ,那么 对 于 无 向 图 ,e 的 取 值 范围 是 0~n(n 一 1)/2。 有 nn 一 1)/ 
2 条 边 的 无 向 图 称 为 完全 图 (completed graph)。 

对 于 有 向 图 ,e 的 取 值 范围 是 0~n(n 一 1)。 具 有 n(n 一 1) 条 弧 的 有 向 图 称 为 有 向 完 
全 图 。 

有 很 少 条 边 或 弧 ( 如 e 二 nlogn) 的 图 称 为 稀疏 图 (spare graph) ,反之 称 为 稠密 图 (dense 
graph) 。 


6.1.2 图 的 基本 术语 
1. 度 、 入 度 和 出 度 


对 于 无 向 图 G 二 (V,E), 如 果 边 (v,v')EE, 则 称 顶 点 v 和 w 互 为 邻接 点 (adjacent) , 即 
v 和 w 相 邻 接 , 边 (v,v ) 依 附 (incident) 于 顶点 v 和 w ,或 者 说 边 (v,v’) 和 顶点 v 和 w 相 
关联 。 

顶点 v 的 度 (degree) 是 和 w 相关 联 的 边 的 数目 , 记 作 TD(v)。 例 如 图 6.1(b) 中 ,图 G。 
中 顶点 v 的 度 是 3。 

对 于 有 向 图 G 二 (V,E), 如 果 弧 (4v,v')EE, 则 称 顶 点 v 邻接 到 顶点 v ,顶点 v' 邻 接 自 
顶点 v。 弧 4v,v ) 和 顶点 vv 相关 联 。 以 顶点 v 为 头 的 弧 的 数目 称 为 v 的 入 度 (indegree)， 
记 为 ID(v); 以 顶点 v 为 尾 的 弧 的 数目 称 为 w 的 出 度 (outdegree), 记 为 OD(v)。 顶 点 v 的 
度 为 ， 

TD(v) =ID(v) + OD(vw) 
如 图 6.1(a) 中 G, 图 : ID(vi)=1,0D(v1)=2,TD(v1)==ID(v1) 十 OD(v1)=3 
一 般 地 ,有 nn 个 顶点 ,e 条 边 或 弧 的 图 ,满足 以 下 关系 : 


e 一 2)TDCV;)/2 
i=1 


2. 子 图 


假设 有 两 个 图 G==(V,E),G’=(V',E')。 如 果 V 包含 于 V,E' 包 含 于 E, 则 称 G 是 G 
的 子 图 (subgraph)。 图 6. 2 是 子 图 的 一 些 示例 。 


3. 路 径 、 回 路 


无 向 图 G 二 (V,E) 中 从 顶点 v 到 顶点 v 的 路 径 (path) 是 一 个 顶点 序列 (v 二 vo ,vn， 
Viz svim 王 Vv ), 其 中 (vi,_1,vj)EE ,1 二 j 三 mn。 如果 G 是 有 向 图 , 则 路 径 也 是 有 向 的 , 顶 
点 序列 应 满足 (vw;,;_1,v;) EE,1<j<n。 

路 径 的 长 度 是 路 径 上 的 边 或 弧 的 数目 。 

第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 (cycle) 或 环 。 序列 中 顶点 不 重复 出 
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图 6.2 子 图 示例 


现 的 路 径 称 为 简单 路 径 。 除 了 第 一 项 点 和 最 后 一 个 顶点 之 外 ,其 余 顶 点 不 重复 出 现 的 回路 ， 
称 为 简单 回路 或 简单 环 。 


4. 连通 图 、 连 通 分 量 


在 无 向 图 G 中 ,如 果 从 顶点 v 到 顶点 v 有 路 径 , 则 称 v 和 w 是 连通 的 。 如 果 对 于 图 中 
任意 两 个 顶点 v;,v; EV,v;,v; 都 是 连通 的 , 则 称 G 是 连通 图 (connected graph)。 例 如 
图 6.1(b) 中 的 Gs 就 是 一 个 连通 图 ,而 图 6.3(a) 中 的 G; 则 是 非 连 通 图 ,但 G3 有 三 个 连通 
分 量 , 如 图 6.3(b) 所 示 。 所 谓 连 通 分 量 (connected component) ,是 指 无 向 图 中 的 极 大 连通 
子 图 。 


(a) 无 向 图 Gs (b) G3 的 三 个 连通 分 量 
图 6.3 无 向 图 及 其 连通 分 量 


在 有 向 图 G 中 ,如 果 对 于 每 一 对 vi,v; EV,vi! 二 vj ,从 vw 到 v; 和 从 vw; 到 ww 都 存在 路 


径 , 则 称 G 是 强 连通 图 。 有 向 图 中 的 极 大 强 连通 子 图 称 为 有 向 图 的 强 连通 分 量 。 例 如 
图 6.1(a) 中 的 Gi 不 是 强 连 通 图 ,但 它 有 两 个 强 连通 分 量 , 如 图 6.4 所 示 。 


5. 生成 树 


一 个 连通 图 的 生成 树 (spanning tree) 是 一 个 极 小 连通 子 图 。 它 含有 图 中 全 部 顶点 ,但 
只 有 足以 构成 一 棵 树 的 nn 一 1 条 边 。 图 6. 3(a) 中 的 Gs 是 一 个 非 连 通 图 , 它 有 三 个 连通 分 
量 ,最 大 的 连通 分 量 的 一 棵 生成 树 如 图 6. 5 所 示 。 
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图 6.4 Gi 的 两 个 强 连通 分 量 图 6.5 Ga 的 最 大 连通 分 量 的 一 棵 生成 树 


树 的 等 价 定义 : 不 含 回路 的 连通 图 叫 作 树 。 如 果 在 一 棵 生成 树 上 添加 一 条 边 ,必定 构 
成 回路 。 因 为 这 条 边 使 得 它 所 依附 的 两 个 顶点 之 间 有 了 第 二 条 路 径 。 一 棵 及 个 顶点 的 
生成 树 , 有 且 仅 及 一 1 条 边 。 如 果 一 个 图 及 个 顶点 和 小 于 一 1 条 边 , 则 它 是 非 连 通 图 。 
如 果 它 有 多 于 n 一 1 条 边 , 则 一 定 有 回路 ,但 是 有 一 1 条 边 的 图 不 一 定 是 生成 树 。 


6. 生成 森林 


如 果 一 个 有 向 图 恰 有 一 个 顶点 的 入 度 为 0, 其 余 顶 点 的 入 度 均 为 1, 则 它 是 一 棵 有 向 树 。 
一 个 有 向 图 的 生成 森林 (spanning forest) 由 若干 棵 有 向 树 组 成 , 它 含 有 图 中 全 部 顶点 ,但 只 
有 足以 构成 若干 棵 不 相交 的 有 向 树 的 弧 ,如 图 6.6 所 示 。 


7. 网 


在 图 的 每 条 边 上 加 一 个 数字 作为 权 (weight) ,如 果 用 顶点 代表 城市 , 权 可 以 表示 两 城市 
之 间 的 距离 或 耗费 。 带 权 的 图 称 为 网 (network) ,如 图 6.7 所 示 的 图 G, 是 一 个 网 。 
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(a) 有 向 图 (b) 生成 森林 
图 6.6 一 个 有 向 图 及 其 生成 森林 图 6.7 网 G， 


另外 ,在 前 面 举例 的 G, .G: .G; 三 个 图 中 ,对 顶点 编 了 号 。 从 图 的 定义 来 看 ,顶点 集 为 
V ,根据 集合 的 定义 ,集合 中 的 元 素 是 无 序 的 ,所 以 无 法 将 图 中 顶点 排 成 一 个 线性 序列 ,任何 
一 个 顶点 都 可 以 看 成 第 一 个 顶点 .编号 为 1。 此 外 . 任 一 顶点 的 邻接 点 之 间 也 不 存在 次 序 关 
系 。 因 此 ,在 图 G1、G,、Gs 中 ,对 顶点 的 编号 完全 是 人 为 的 。 


8. 图 的 ADT 


在 已 知 图 的 逻辑 结构 和 确定 运算 后 就 可 以 定义 图 的 抽象 数据 类 型 。ADT6. 1 是 图 的 抽 
象 数 据 类 型 描述 ,其 中 只 包含 最 常见 的 图 运算 。 


ADT6.1 图 ADT 

ADT graph{ 

数据 对 象 : 

V 二 {a;la;€ 元 素 集合 ,i 二 1,2,… ,n,n 宇 0} 

数据 关系 R: 

R={VR} 

VR={(v,w)| v,wEV, 且 Pv,w),(v,w) 表 示 从 v 到 w 的 弧 。P(v,w) 定 义 了 弧 
《vs,w) 的 意义 或 信息 } 

基本 操作 : 

creat() : 创建 一 个 部 包含 任何 边 的 有 向 图 。 

destroy() : 撤销 一 个 有 向 图 。 

exist(u,v): 若 图 中 存在 弧 (x ,u), 则 返回 1 ,否则 返回 0。 

insert(u,v,w): 向 图 中 添加 权 为 w 的 弧 4x,u) , 若 插入 成 功 , 则 返回 1 ,否则 返回 0。 

remove(u,v): 从 图 中 删除 弧 《u,v), 若 图 中 不 存在 弧 4u,v), 则 返回 0; 若 图 中 存在 弧 
《u,v0), 则 从 图 中 删除 此 弧 并 返回 1。 

vertices() : 返回 图 中 顶点 数目 。 

;ADTgraph 


6.2 图 的 存储 结构 


图 的 存储 结构 有 多 种 形式 ,下 面 只 研究 其 中 的 三 种 : 邻接 和 矩阵、 邻接 表 、 十 字 链 表 。 在 
这 三 种 形式 中 ,最 常用 的 是 前 两 种 。 


6.2.1 邻接 矩阵 


邻接 矩阵 (adjacency matrix) 是 表示 顶点 间 相 邻 关 系 的 矩阵 。 若 G 是 一 个 具有 个 顶 
点 的 图 , 则 G 的 邻接 矩阵 是 如 下 定义 的 nXn 矩阵 : 
1 (vi,v;) 或 (Vj; ,V;) 是 图 的 边 


ai 一 


0 ”其 他 
例如 ,图 6.1 中 的 有 向 图 C; 和 无 向 图 C* 的 邻接 矩阵 如 下 : 
010 10 
0101 
:0 
0 0 0 0 
4; 一 As=|0 1 oo11 
LO 0 
lo 0.0 
Ck 
(0 Ee 


显然 ,无 向 图 的 邻接 矩阵 是 对 称 的 ,因为 当 (v;,v;)EE 时 ,也 有 (vj,v;)EE。 有 向 图 
的 邻接 矩阵 则 不 一 定 对 称 ,所 以 用 邻接 矩阵 表示 一 个 及 个 顶点 的 有 向 图 时 ,所 需要 的 存 
储 空间 为 n?。 

图 的 邻接 矩阵 完全 表示 了 一 个 图 。 例 如 ,对 于 无 向 图 G 中 任意 一 顶点 ui ,车 要 求 w 的 
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度 , 则 
TD = Sa, 

对 于 有 向 图 G, 若 要 求 V; 的 入 度 , 则 人 
mto)= Da 

若 要 求 w 的 出 度 , 则 本 
OD(v,) = Do 


对 于 网 ,其 邻接 和 矩阵 中 值 为 1 的 元 素 可 用 边 上 的 权 代替 。 有 时 还 可 根据 需要 ,将 网 的 邻 
接 和 矩阵 中 的 所 有 的 0 用 == 来 代替 。 例 如 图 6.7 中 的 网 C, 的 邻接 矩阵 如 下 : 


co 4 ceo co 2 


4 co 3 6 3 
oo 3 co 4 ce 
co 6 4 co 5 
2 3 © 5 © 
除了 需要 一 个 二 维 数组 存储 顶点 之 间 相 邻 关系 的 邻接 矩阵 外 ,通常 还 需要 使 用 一 个 具 
有 nn 个 元 素 的 一 维 数组 存储 项 点 信息 ,其 中 下 标 为 i 的 元 素 存 储 顶 点 wv; 的 信息 。 
如 果 用 一 个 二 维 数组 定义 一 个 及 个 顶点 的 图 G 的 邻接 矩阵 ,要 检查 G 中 有 多 少 条 
边 , 需 要 的 时 间 为 O(n*)。 当 图 的 邻接 矩阵 是 稀疏 和 矩阵 时 ,为 确定 边 的 条 数 , 有 大 量 的 零 元 
素 要 检查 ,所 以 很 浪费 时 间 。 


6.2.2 邻接 表 


邻接 表 (adjacency) 是 图 的 另 一 种 存储 结构 。 

在 邻接 表 中 ,对 图 中 每 个 项 点 建立 一 个 单 链表 ,顶点 w 的 单 链表 中 的 结 点 是 w 的 所 有 
邻接 点 。 在 有 向 图 中 ,顶点 w 的 单 链表 中 的 结 点 是 以 v; 为 弧 尾 的 顶点 。 每 一 个 结 点 由 三 
个 域 组 成 ,其 中 邻接 点 域 (adjvex) 指 示 与 顶点 v; 邻接 的 点 在 图 中 的 编号 ; 链 域 (nextarc) 指 
示 下 一 条 边 或 弧 的 结 点 ; 数据 域 (info) 存 储 和 边 或 弧 相关 的 信息 ,如 权 值 等 。 每 一 个 链表 上 
附设 一 个 头 结 点 ,在 头 结 点 中 ,除了 设 有 和 链 域 (firtarc) 指 向 链表 第 一 个 结 点 外 ,还 设 有 存储 
v; 的 名 或 其 他 有 关 信 息 的 数据 域 (vexdata) ,这 些 结 点 的 结构 如 下 所 示 。 

头 结 点 通常 以 顺序 结构 的 形式 存储 ,以 便 随机 访问 任 一 顶点 的 链表 。 

例如 ,图 6.1 所 示 的 G, 和 G， 的 邻接 表 如 图 6. 8 所 示 。 

从 这 两 个 例子 可 以 看 出 ,每 个 单 链表 相当 于 邻接 矩阵 的 一 行 , 它 存 储 了 邻接 矩阵 某 一 行 
中 的 非 零 元 素 。 这 种 存储 结构 可 定义 如 下 : 


# define max_vertex num 20 // 最 大 顶点 数 
struct arcnode 
{ 

int adjvex; 

struct arcnode * nextarc; 


infotype info; // 和 弧 有 关 的 其 他 信息 


}; 

typedef struct arcnode * arcptr; 

typedef struct vexnode 

{ 
vextype vexdata; // 和 项 点 有 关 的 信息 
arcptr firstarc; 

}adjlist[max vertex num+1]; 


| adjvex | nextarc | info | 


表 结 点 


vexdata | firstarc 


> 


3 be re 式 人 


4 一 一 3 | 和 


(a) G1 的 邻接 表 


1 | 4 | T=-|2| 信 
2 | 5 ~ 3 1 | 人 
3 -| 5 一 | 4 | 2 | 和 
4 | 3 -| 1 | 和 
5 J—|3| |2|A 

(b) Gz 的 邻接 表 


图 6.8 Gi、G: 的 邻接 表 存 储 结 构 


若 无 向 图 有 个 顶点 ,e 条 边 , 则 它 的 邻接 表 需 ”个 头 结 点 ,2e 个 表 结 点 。 显 然 , 当 边 
稀 朴 时 , 即 e 远 小 于 n(n 一 1)/2 时 ,用 邻接 表 表 示 图 比 用 邻接 矩阵 节省 存储 空间 , 当 和 边 相 
关 的 信息 较 多 时 更 是 如 此 。 

在 无 向 图 的 邻接 表 中 ,顶点 v; 的 度 恰 为 第 i 个 链表 中 的 表 结 点 数 ; 而 在 有 向 图 中 ,第 i 
个 链表 中 的 表 结 点 个 数 只 是 顶点 v; 的 出 度 。 为 求人 度 ,必须 遍历 整个 邻接 表 。 在 邻接 表 中 
邻接 点 域 的 值 为 i 的 结 点 的 个 数 是 顶点 v; 的 和 人 度 。 有 时 为 了 便于 确定 顶点 的 人 度 或 以 顶 
点 为 头 的 弧 ,可 以 建立 一 个 有 向 图 的 道 邻接 表 , 即 对 


每 一 个 顶点 w 建立 一 个 以 w 为 头 的 弧 的 表 , 如 图 6.9 | MA 
所 示 为 有 向 图 G, 的 道 邻 接 表 。 i A 

在 邻接 表 上 容易 找到 任 一 顶点 的 所 有 邻接 点 ,但 是 三 | | 人 
判定 任意 两 顶点 (w 和 ) 之 间 是 否 有 边 或 弧 相连 , 则 需 一 | EA 


要 搜索 第 i 个 或 第 j 个 链表 ,此 时 邻接 表 不 如 邻接 矩阵 图 6.9 Gi 的 道 邻接 表 
方便 。 
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算法 6.1 构造 图 的 邻接 表 算 法 


void setadjlist(adjlist graph) // 根 据 所 读 入 的 边 , 建立 图 的 邻接 表 graph 
{ 

int v1,v2; 

arcptr p,q; 

scanf("%d$%d",&vl,&v2); // 读 入 第 一 条 边 (v1,v2) 

while(v1!= 0) // 边 的 结束 标志 v1 = 0 


{ 
q= (arcptr)malloc( sizeof(arcnode)); 
q->adjvex= v2; 
q -> nextarc = NULL; 
if (graph[v1].firstarc == NULL) 
graph[v1].firstarc= q; 
else 
{ // 尾 插 法 插入 单 链表 
p= graph[v1].firstarc; 
while(p—> nextarc) 
p=p->nextarc; 
p->nextarc=q; 
} 
scanf("%d%d",&vl,&v2); // 读 入 下 一 条 边 


; 


6.2.3 十 字 链 表 


十 字 链 表 (orthogonal list) 是 有 向 图 的 另 一 种 链 式 存储 结构 ,可 以 看 成 是 将 有 向 图 的 邻 
接 表 和 道 邻接 表 结 合 起 来 得 到 的 一 种 链表 。 在 十 字 链 表 中 ,对 应 于 有 向 图 中 每 一 条 弧 有 一 
个 结 点 ,对 每 一 个 顶点 也 有 一 个 结 点 ,这 些 结 点 的 结构 如 下 所 示 。 


tailvex headvex hlink tlink 


弧 结 点 


data firstin firstout 


顶点 结 点 


在 弧 结 点 中 有 四 个 域 : 尾 域 tailvex 和 头 域 headvex 分 别 指示 弧 尾 和 弧 头 这 两 个 顶点 在 
图 中 的 编号 ; 链 域 hlink 指向 弧 头 相同 的 下 一 条 弧 ; 链 域 tlink 指向 弧 尾 相同 的 下 一 条 弧 。 
弧 头 相同 的 弧 在 同一 链表 上 , 弧 尾 相同 的 弧 也 在 同一 链表 上 。 它 们 的 头 结 点 即 为 顶点 结 点 ， 
由 三 个 域 组 成 : 其 中 data 域 存储 和 顶点 相关 的 信息 ; firstin 和 firstout 为 两 个 链 域 ,分别 指 
向 以 该 项 点 为 弧 头 或 弧 尾 的 第 一 个 弧 结 点 。 

有 向 图 Gs 以 及 Gs 的 十 字 链 表 如 图 6. 10 所 示 。 

若 将 有 向 图 的 邻接 矩阵 看 成 稀 玻 矩阵 , 则 十 字 链 表 也 可 看 成 邻接 矩阵 的 链表 存储 结构 。 
只 是 在 图 的 十 字 链 表 中 , 弧 结 点 所 在 的 链表 不 是 循环 链表 , 表 头 结 点 即 项 点 之 间 用 顺序 存储 。 


G) 1) 4 ~[4[ 1 [^[ 寺 -|L[2T^ -FT| 


(a) 有 向 图 Gs (b) Gs 的 十 字 链 表 
图 6.10 有 向 图 Gs 以 及 Gs 的 十 字 链 表 
有 向 图 的 十 字 链 表 类 形 定义 如 下 : 


typedef struct arctype 
{ 


int tailvex, headvex; 

struct arctype * hlink, * tlink; 
} * arclink; 
typedef struct vnode 

vertex data; 

arclink firstin, firstout; 
}ortholist; 


只 要 输入 个 顶点 的 信息 和 e 条 弧 的 信息 , 便 可 建立 该 有 向 图 的 十 字 链 表 。 
算法 6.2 ”建立 有 向 图 的 十 字 链 表 存 储 结构 算法 。 


void crt_ortho(ortholist ga[ ]) 
{ 
int n,e,i,j,k; 
arclink p; 
scanf(" %d%d", gn, &e); // 输 入 顶点 和 弧 的 数目 
for(i=1;i<=n;it+) 
{ 
scanf(" 名 d",&ga[i]. data); // 输 入 顶点 信息 ,此 处 假定 项 点 信息 为 int 类 型 
ga[lil].firstin = NULL; 
ga[ i]. firstout = NULL; // 指 针 初 始 化 
lL 
for(k=1;k<= e;k++) 
{ 
scanf(" %d%d", &i, &j); // 输 入 弧 的 信息 ,二 是 弧 尾 顶点 的 编号 ,j 是 弧 头 顶点 的 编号 
p= (arclink)malloc( sizeof(arctype)); 
p->tailvex= i; p 一 > headvex = j; 
// 将 弧 结 点 采用 头 插 法 分 别 插入 到 两 个 链表 中 
p->hlink= ga[j].firstin; ga[il].firstin= p; 
p->tlink= ga[i].firstout; ga[i].firstout = p; 
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在 十 字 链 表 中 既 容 易 找到 以 vi 为 尾 的 弧 ,也 容易 找到 以 v; 为 头 的 弧 , 因 而 容易 求 得 顶 
点 的 出 度 和 入 度 。 在 某 些 有 向 图 的 应 用 中 ,十字 链 表 是 很 有 用 的 工具 。 


6.2.4 边 集 数组 


边 集 数组 是 利用 一 维 数组 存储 图 中 所 有 边 的 一 种 图 的 表示 方法 。 该 数组 中 所 含 元 素 的 
个 数 要 大 于 或 等 于 图 中 的 边 数 ,每 个 元 素 用 来 存储 一 条 边 的 起 点 ,终点 (对 于 无 向 图 ,可 选 定 
边 的 任 一 端点 作为 起 点 或 终点 ) 和 权 ( 若 有 的 话 ) 。 各 边 在 数组 中 的 次 序 可 任意 安排 ,也 可 根 
据 具体 要 求 而 定 。 边 集 数 组 只 是 存储 图 中 所 有 边 的 信息 , 若 需 要 存储 顶点 信息 ,同样 需要 一 
个 具有 nn 个 元 素 的 一 维 数组 ,图 6. 11 是 图 6.7 所 示 图 G, 对 应 的 边 集 数组 。 


fromvex 1 1 2 2 2 4 4 
endvex | 2 5 3 4 5 4 5 
weight | 4 | 2 | 3 | 6 | 3 4 | 5 


图 6.11 图 G, 的 边 集 数组 


边 集 数组 中 的 元 素 类 型 和 边 集 数组 类 型 定义 如 下 : 


struct edge // 定 义 边 集 数组 的 元 素 类 型 
{ 
int fromvex; // 边 的 起 点 域 
int endvex; // 边 的 终点 域 
int weight; // 边 的 权 值 域 ,对 应 无 权 图 可 省 去 此 域 
}; 
typedef edge edgeset[maxedgenum]; // 定 义 edgeset 为 边 集 数组 类 型 


算法 6.3 建立 一 个 带 权 图 的 边 集 数 组 表示 的 算法 。 


// 通 过 从 键盘 上 输入 的 n 个 项 点 信息 和 e 条 边 的 信息 
// 建 立项 点 数组 gv 和 边 集 数组 ge 
void createdgeset (vextype gv[ ], edgeset ge, int n, int e) 
{ 
int i,k,j,w; 
for (i=0;i<n;it+) 
scanf("%c",&gv[i]); // 输 入 项 点 信息 
for(k = 0;k<e;kt+) 
{ 
scanf(" %d%d%d", &i, &j, gm); // 输 入 一 条 边 的 起 点 、 终 点 和 权 值 
ge[k]. fromvex = i; 
ge[k]. endvex = j; 
ge[k].weight = w; 


} 


在 边 集 数组 中 查找 一 条 边 或 一 个 顶点 的 度 都 需要 扫描 整个 数组 ,所 以 其 时 间 复 杂 度 为 
O(e)。 边 集 数 组 适合 那些 对 边 依次 进行 处 理 的 运算 ,不 适合 对 顶点 的 运算 和 对 任 一 条 边 的 
运算 。 边 集 数组 表示 的 空间 复杂 度 为 O(e)。 从 空间 复杂 度 上 讲 , 边 集 数组 也 适合 表示 稀 
玻 图 。 
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图 的 邻接 和 矩阵、 邻接 表 和 边 集 数 组 表示 法 各 有 利 整 ,具体 应 用 时 ,要 根据 图 的 稠密 程度 
以 及 算法 的 要 求 进行 选择 。 


6.3 图 的 遍历 


图 的 遍历 (traversing graph) 与 树 的 遍历 类 似 , 其 含义 是 : 从 图 中 某 一 给 定 顶点 we 出 发 
访问 图 中 其 余 项 点 ,使 得 每 个 顶点 都 被 访问 一 次 且 仅 被 访问 一 次 ,这 一 过 程 称 为 图 的 遍历 。 
图 的 遍历 算法 是 实现 图 上 其 他 算法 的 基础 。 

图 的 遍历 要 比 树 的 遍历 复杂 得 多 ,因为 图 的 任 一 顶点 都 可 以 与 其 余 项 点 相 邻 接 , 所 以 在 
访问 某 个 顶点 之 后 ,有 可 能 沿 着 某 条 路 径 搜索 ,又 回 到 这 个 顶点 。 例 如 图 6. 1 中 的 G: ,由 于 
图 中 存在 着 回路 ,因此 在 访问 了 vi、vs、vs、vs 之 后 , 沿 着 边 (ui ,ui ) 又 回 到 w ,这 种 现象 增 
加 了 遍历 图 的 复杂 度 。 事 实 上 ,同一 顶点 被 访问 多 次 确实 没有 必要 ,为 了 避免 发 生 这 种 现 
象 ,在 遍历 图 的 过 程 中 ,必须 对 某 个 顶点 已 被 访问 这 一 信息 记录 下 来 ,为 此 设 一 辅助 数组 
visited[1..2j, 它 的 初始 值 为 “ 假 ”。 一 旦 某 个 顶点 v; 已 被 访问 , 便 置 visited[i] 为 *“ 真 "。 这 
样 ,就 可 随时 根据 数组 visited 中 的 元 素 visited[i] 为 “ 真 ” 还 是 为 “ 假 ”, 判 断 图 中 的 顶点 v， 
是 否 已 被 访问 了 。 

对 树 的 遍历 有 先 根 遍 历 、 后 根 遍 历 、 层 次 遍历 等 ,这 是 人 为 规定 的 一 种 遍历 的 次 序 。 在 
图 的 遍历 中 ,也 规定 了 两 种 遍历 方式 : 深度 优先 搜索 和 广度 优先 搜索 。 它 们 对 无 向 图 和 有 
向 图 都 适合 。 深 度 优先 搜索 是 树 的 先 根 遍 历 的 推广 ; 广度 优先 搜索 是 树 的 层次 遍历 的 推 
广 。 下 面 首先 介绍 连通 的 无 向 图 和 强 连 通 图 的 遍历 。 一 般 图 的 深度 优先 .广度 优先 遍历 算 
法 在 6.4 节 介绍 。 


6.3.1 深度 优先 搜索 


深度 优先 搜索 (Depth First Search,DFS) 思 想 如 下 : 假设 初始 状态 是 图 中 所 有 顶点 都 
没 被 访问 过 , 则 DFS 可 从 图 中 某 一 顶点 we 出 发 ,首先 访问 v。; 然后 访问 与 w。 邻接 但 未 被 
访问 过 的 任 一 顶点 vi ; 接着 再 去 访问 与 w 邻接 但 未 被 访问 过 的 任 一 顶点 v,。 重 复 这 一 过 
程 , 当 到 达 一 个 所 有 邻接 的 顶点 均 被 访问 过 的 顶点 时 , 则 依次 退回 到 最 近 被 访问 过 的 顶点 。 
若 它 还 有 邻接 点 未 被 访问 过 ,从 这 些 未 被 访问 过 的 顶点 中 , 任 取 其 中 的 一 顶点 开始 重复 这 一 
过 程 ; 若 所 有 邻接 顶点 均 被 访问 过 , 则 依次 退回 …… 直到 所 有 顶点 被 访问 过 为 止 。 

例如 ,在 图 6. 12 所 示 的 图 G。 中 ,假设 从 顶点 v, 出 发 进行 搜索 ,在 访问 了 顶点 vi 之 后 ， 
从 vi 的 未 曾 访 问 过 的 邻接 点 wz \vs 中 选择 v, ,访问 之 ; 再 从 vs 出 发 ,从 vw 未 被 访问 的 邻 
接点 vs、vs 中 选择 v ,访问 之 。 然 后 从 wv 出 发 ,此 时 wv 的 未 被 访问 过 的 邻接 点 只 有 vs , 访 
问 vs， ws 的 未 曾 被 访问 的 邻接 点 只 有 us ,访问 之 。 此 时 ,us 的 两 个 邻接 点 ws .us 都 已 被 访 
问 。 按 原 路 返回 到 vs ,由 于 vs 的 两 个 邻接 点 v,、vs 已 被 访问 ,再 返回 到 v,。w 的 情况 和 
vs 一 样 ,所 以 再 返回 到 ws 。zvs 的 情况 和 w, 一样 ,再 返回 到 w 。 由 于 w 的 两 个 邻接 点 中 ， 
vz 已 被 访问 但 ws 还 未 被 访问 过 ,于 是 接着 访问 ws 。 再 从 vs 的 两 个 未 被 访问 过 的 顶点 we、 
vi 中 选择 ws 访问 之 。w。 的 邻接 点 是 w 和 u ,其 中 us 已 被 访问 过 , 则 访问 wy 。 这 时 图 中 
所 有 的 顶点 均 已 被 访问 ,DFS 法 遍历 图 Ge 的 全 过 程 结 束 。 由 此 得 到 一 顶点 的 访问 序列 : 


185 


NA 
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一 0 一 UVs 一 0 一 03 一 0 一 u7。 对 图 G。 进行 深度 优先 搜索 的 过 程 如 图 6. 13 所 示 。 
图 中 以 带 箭头 的 粗 实 线 表示 遍历 时 的 访问 路 径 ,以 带 箭头 的 虚线 表示 回溯 的 路 径 。 图 中 的 
小 圆圈 表示 已 被 访问 过 的 邻接 点 ,大 圆圈 表示 访问 的 邻接 点 。 


图 6.12 连通 的 无 向 图 G。 图 6.13 Gs 的 深度 优先 搜索 的 过 程 


显然 ,用 DFS 法 遍历 图 ,得 到 的 结 点 序列 是 不 唯一 的 ,例如 还 可 以 用 DFS 法 遍历 Ge ,得 
到 另 一 访问 序列 : vvs>vs Vs 六 V4 六 Vs 了 U1 六 Us。 

再 看 一 个 有 向 图 的 例子 。 

图 6. 14 所 示 ,G; 是 一 个 有 向 图 , 按 定义 它 不 是 一 个 强 连通 图 。 如 果 从 A 出 发 ,用 深度 
优先 搜索 ,所 得 到 的 顶点 序列 为 : A.B,C.D。 即 从 A 出 发 访问 A, 然 后 选择 A 的 邻接 点 B， 
访问 之 ,B 有 两 个 邻接 点 C.D, 选 择 C, 访 问 之 ,由 于 邻接 于 C 的 顶点 A 已 访问 ,所 以 回 到 B， 
从 也 的 另 一 个 邻接 点 D 出 发 ,访问 D, 这 时 ,D 的 两 个 邻接 点 A 和 C 都 已 经 被 访问 过 ,所 以 
返回 到 B,B 的 邻接 点 已 访问 过 ,返回 A, 邻接 于 A 的 结 点 也 都 已 访问 。 但 是 此 时 G, 中 还 有 
三 个 顶点 EE.F\G 没有 被 访问 ,上 面 的 访问 只 是 遍历 了 G; 的 一 个 子 图 。 


图 6.14 有 向 图 G， 


其 实 这 个 过 程 类 似 于 森林 的 遍历 , 仅 遍 历 了 一 棵 树 。 在 无 向 图 的 条 件 下 遍历 了 一 个 连 
通 分 量 ; 在 有 向 图 的 条 件 下 ,遍历 了 所 有 从 顶点 A 出 发 可 到 达 的 顶点 。 如 果 是 强 连通 的 有 
向 图 或 连通 的 无 向 图 , 则 按 上 述 介绍 的 DFS 方法 能 够 连续 地 访问 图 中 的 所 有 项 点。 否则， 


但 是 如 果 出 发 点 选择 顶点 下 , 则 可 调用 DFS 方法 一 次 连续 地 遍历 图 。 所 得 到 的 顶点 序 
列 为 : E,G,F,B,D,C,A。 由 此 看 来 ,对 于 有 向 图 G ,如果 G 非 强 连通 ,恰当 地 选择 出 发 点 ， 
也 可 一 次 连续 地 DFS 遍历 图 G。 

另外 ,还 可 以 用 递归 的 方式 给 出 DFS 方 法 的 定义 。 初 始 状 态 是 图 中 所 有 顶点 未 曾 被 访 
问 过 , 则 DFS 方法 可 从 某 一 指定 顶点 we 出 发 ,访问 此 顶点 ,然后 依次 从 v。 的 未 被 访问 过 的 
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邻接 点 出 发 深度 优先 遍历 图 ,直到 图 中 所 有 与 v。 有 路 径 相 通 的 顶点 都 被 访问 到 为 止 。 
假设 图 G 用 邻接 表 存 储 ,从 v。 出 发 遍历 G 的 递归 过 程 如 算法 6.4 所 示 。 
算法 6.4 深度 优先 遍历 图 的 递归 算法 。 


// 假 设 图 6G 有 n 个 项 点 ,用 邻接 表 存 储 6,DFS 遍历 图 G 
int visited[max vertex num+1]= {0}; 
void dfs(adjlist graph, int v) 
{ 
arcptr p; 
visit(v); 
visited[v] =1; 
p= graph[v].firstarc; 
while(p) 
人 
if(!visited[p— >adjvex]) 
dfs(graph,p 一 > adjvex); 
p=p->nextarc; 


} 


DFS 遍历 图 G 的 方法 也 可 以 用 非 递归 的 描述 , 当 访 问 了 图 中 一 个 顶点 之 后 , 若 它 的 所 
有 邻接 点 均 已 被 访问 过 了 , 则 要 按 原 路 返回 到 前 一 个 项 点; 车 这 个 顶点 的 所 有 顶点 也 都 被 
访问 过 了 , 则 再 按 原 路 返回 到 它 的 前 一 个 项 点 。 因 此 返回 的 次 序 是 : 先 访问 的 顶点 后 返回 ， 
后 访问 的 顶点 先 返回 。 所 以 对 于 非 递 归 的 DFS 算法 来 说 ,需要 借助 一 个 栈 。 在 遍历 的 过 程 
中 ,每 当 访问 了 一 个 顶点 v, 就 将 v 推进 栈 ; 接着 继续 访问 v 的 下 一 个 未 被 访问 过 的 邻接 
点 。 如 果 v 的 所 有 邻接 点 都 已 被 访问 过 ,那么 使 v 退 栈 ,再 去 访问 新 的 栈 顶 元 素 的 下 一 个 
未 被 访问 过 的 邻接 点 。 这 一 过 程 一 直 进行 到 栈 空 为 止 。 非 递归 的 DFS 算法 如 算法 6.5 
所 示 。 

算法 6.5 深度 优先 遍历 图 的 非 递归 算法 。 


// 假 设 图 6 用 邻接 表 存 储 ,从 顶点 v 出 发 非 递 归 地 DFS 图 G, stack 是 一 个 顺序 栈 
int visited[max vertex num+1]= {0}; 
int stack[max_vertex num+1]; 
void unrecurrentdfs(adjlist graph, int v) 
{ 
visit(v); 
int 让 
arcptr p; 
visited[v] =1; 
i=1; //i 为 栈 顶 指针 
stack[i] =v; /Wy 进 栈 
p= graph[v].firstarc; 
while(i!= 0) // 若 栈 不 空 
{ 
while(p&&visited[p— > adjvex]) 
p=p->nextarc; 
if(!p) // 顶 点 p 的 所 有 邻接 点 都 已 访问 过 了 
{ 
i-——;} // 退 栈 
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if(i) 
p= graph[ stack[i]].firstarc; 
//p 取 新 的 栈 顶 元 素 的 邻接 点 


else 


visit(p—>adjvex); 
visited[p—>adjvex] = 1; 

EE 

stack[ i] =p -> adjvex; 

p= graph[p ->adjvex].firstarc; 


} 


遍历 图 的 过 程 实质 上 是 对 每 个 项 点 查找 其 邻接 点 的 过 程 。 当 以 邻接 表 作 为 图 的 存储 结 
构 时 , 找 邻 接点 所 需 的 时 间 为 O(e) ,其 中 *e 为 无 向 图 中 边 的 数目 或 有 向 图 中 弧 的 数目 ,由 此 
以 邻接 表 作为 存储 结构 时 ,DFS 遍历 图 的 时 间 复 杂 度 为 O(e)。 


6.3.2 广度 优先 搜索 


广度 优先 搜索 (Breadth-First Search,BFS) 的 思想 是 : 假设 初始 状态 是 图 中 所 有 顶点 都 
没 被 访问 过 , 则 从 图 中 某 一 指定 顶点 we 出 发 ,首先 访问 v ,然后 访问 we 的 全 部 邻接 点 ww ， 
rt 再 依次 访问 与 ww ,ws，… ,rw 邻接 的 全 部 邻接 点 (已 被 访问 的 顶点 除外 ); 再 从 
这 些 被 访问 的 顶点 出 发 ,逐次 访问 它们 的 邻接 点 (已 被 访问 的 项 点 除外 )。 以 此 类 推 ,直到 所 
有 顶点 都 被 访问 完 为 止 。 换 句 话说 ,广度 优先 搜索 遍历 图 的 过 程 是 以 we 为 起 点 ,由 近 至 远 ， 
依次 访问 和 vw。 有 路 径 相通 且 路 径 长 度 为 1,2,… 的 顶点 。 

例如 ,对 图 6. 12 中 的 无 向 图 G。 进行 BFS 遍历 图 的 过 程 是 : 首先 访问 v, 和 ww 的 邻接 
点 wu 和 vw; 然后 依次 访问 w* 的 邻接 点 w 和 ws 及 vs 的 邻接 接点 v。 和 wi ,最 后 访问 w 的 
邻接 点 ws 。 由 于 这 些 顶 点 的 邻接 点 均 已 被 访问 ,并 且 图 中 所 有 顶点 都 被 访问 ,因此 完成 了 
图 的 遍历 。 遍历 过 程 如 图 6. 15 所 示 ,得 到 的 顶点 访问 序列 为 : 


Vi” UU YU ”Us YU UUs 


图 6.15 图 Gs 的 广度 优先 搜索 过 程 
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和 深度 优先 搜索 类 似 ,BFS 在 遍历 的 过 程 中 也 需要 辅助 数组 visited[1..n]。 并 且 , 为 了 
顺序 访问 路 径 长 度 为 1,2,… 的 顶点 ,需要 附设 队列 ,用 于 存储 已 被 访问 的 路 径 长 度 为 1 ,2,…， 
的 顶点 。BFS 遍历 的 算法 如 算法 6. 6 所 示 。 

算法 6.6 图 的 广度 优先 遍历 算法 。 

// 从 出 发 广度 优先 遍历 图 G 

int visited[max vertex num+1]= {0}; 

void bfs( GRAPH graph[ ], int v) 


{ 


} 


int w; 
visit(v); 
visited[v] =1; 
iniqueque(Q); // 初 始 化 设置 空 队 列 0 
enqueque(Q,v) ; //v 进 队列 0 
while( !empty(Q)) // 当 队列 不 空 时 
{ 
v= dequeque(Q); // 队 头 元 素 v 出 队列 
w= firstadj(graph, v); // 求 v 的 第 一 个 邻接 点 
while(w) /Wr 不 是 最 后 一 个 邻接 点 


{ 
if(!visited[w]) 
{ 
visit(w); 
visited[w] = 1; 
enqueque(Q, w); // 顶 点 w 进 队列 Q 
} 
w= nextadj(graph, v, w); 
// 求 下 一 个 邻接 点 ,已 知 w 为 图 9g 中 顶点 v 的 某 个 邻接 点 
// 求 顶点 w 的 下 一 个 邻接 点 , 若 w 是 v 的 最 后 一 个 邻接 点 , 则 函数 nextadj 的 值 为 0 


算法 6.6 仅 是 一 个 BFS 算法 的 框架 。 具 体 实现 时 ,还 应 考虑 下 述 问题 。 

(1) 要 确定 图 G 的 存储 方式 。 在 参数 表 中 , 仅 象征 性 地 给 出 了 GRAPH graph, 至 于 
GRAPH 具体 是 图 的 哪 种 存储 方式 ,在 实现 算法 时 还 需要 确定 。 

(2) 对 队列 的 操作 iniqueque(Q) (初始 化 队列 )、enqueque(Q.v)( 进 队列 )、dequeque 
(Q) (出 队列 ) empty(Q) (队列 判 空 ) 这 几 个 操作 要 细 化 。 

(3) 当 GRAPH 的 类 型 确定 后 ,在 图 的 存储 结构 上 的 操作 firstadj (graph,v)( 求 v 的 第 
一 个 邻接 点 ) .nextadj(graph,v,w)( 求 v 的 w 之 后 的 下 一 个 邻接 点 ) 这 两 个 操作 也 要 细 化 。 

只 有 上 述 工作 都 完成 了 以 后 ,算法 6. 6 才 是 一 个 离 可 上 机 的 程序 不 远 的 算法 。 

最 后 ,分析 算法 6.6, 每 一 个 顶点 至 多 进 一 次 队列 ,遍历 图 的 过 程 实质 上 是 通过 边 或 弧 
找 邻接 点 的 过 程 。 因 此 BFS 和 DFS 的 时 间 复 杂 度 相同 ,两 者 的 不 同 之 处 仅 在 于 对 顶点 访 
问 的 顺序 不 同 。 
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(6.4 图 的 连通 性 
A 


6.4.1 无 向 图 的 连通 分 量 


在 对 无 向 图 进行 遍历 时 ,对 于 连通 图 , 仅 需 一 次 调用 搜索 过 程 DFS 或 BFS。 换 句 话 说 ， 
即 从 图 中 任 一 顶点 出 发 , 便 可 遍历 整个 图 。 若 G 是 一 无 向 图 , 且 非 连通 ,从 G 中 某 一 顶点 vw 
出 发 遍历 图 ,不 能 访问 到 G 的 所 有 顶点 ,而 只 能 访问 到 包含 该 项 点 v 的 极 大 的 连通 子 图 , 即 
G 的 一 个 连通 分 量 中 的 所 有 顶点 。 若 从 无 向 图 的 每 个 连通 分 量 中 的 一 个 顶点 出 发 遍历 图 ， 
则 可 求 得 无 向 图 的 所 有 连通 分 量 。 
当然 ,在 调用 DFS 或 BFS 算 法 时 ,要 对 图 的 每 一 个 顶点 进行 检查 。 若 顶点 被 访问 过 ， 
则 该 顶点 落 在 图 中 已 被 求 过 的 连通 分 量 上 ; 若 项 点 未 被 访问 过 , 则 从 该 项 点 出 发 遍历 图 ; 
如 此 反复 , 便 可 求 得 无 向 图 所 有 的 连通 分 量 。 
算法 6.7 求 无 向 图 所 有 的 连通 分 量 算法 。 
int visited[max vertex num+1]= {0}; 
int n= 图 的 顶点 数 ; 
void comp(adjlist graph) 
| for(vi=1;vi<=n;vi+t+) 
if(!visited[vi]) 
{ 


printf("a connected component is "); 


dfs(graph, vi); // 调 用 深度 优先 搜索 算法 


} 


如 果 图 G 用 邻接 表 表示 ,因为 DFS( 或 BFS) 所 需 时间 为 Ole), 故 求 G 的 所 有 连通 分 量 
的 时 间 复 杂 度 为 O(n 十 e)。 


6.4.2 生成 树 和 最 小 代价 生成 树 


设 G=(V,E) 是 一 个 连通 无 向 图 , 则 从 图 中 任 一 顶点 出 发 进行 遍历 操作 ,能 将 EE 分 成 
两 个 集合 T(G) 和 B(G), 其 中 T(G) 是 遍历 图 时 所 经 过 的 边 集 ,B(G ) 是 剩余 的 边 集 。 显 
然 ,T(G) 和 图 G 中 所 有 顶点 一 起 构成 连通 图 G 的 极 小 连通 子 图 , 按 6.1 节 的 定义 , 它 是 连 
通 图 的 一 棵 生成 树 。 由 DFS 得 到 的 是 深度 优先 生成 树 ,由 BFS 得 到 的 是 广度 优先 生成 树 。 
图 6.16(a) 和 图 6. 16(b) 所 示 分 别 为 连通 图 G。 的 深度 优先 生成 树 和 广度 优先 生成 树 , 图 中 
虚线 为 集合 B(G) 中 的 边 。 

对 于 非 连 通 图 ,每 个 连通 分 量 中 的 项 点 集 和 遍历 时 走 过 的 边 一 起 构成 若干 棵 生成 树 ,这 
些 连通 分 量 的 生成 树 组 成 非 连 通 图 的 生成 森林 。 例 如 ,图 6. 17 所 示 为 Cs 的 深度 优先 生成 
森林 , 它 由 三 棵 深度 优先 生成 树 组 成 。 

如 果 用 图 G 的 顶点 表示 城市 , 边 表示 连接 两 城市 之 间 的 通信 线路 。 车 有 个 城市 , 则 
连接 n 个 城市 最 少 要 一 1 条 线路 。 图 G 的 生成 树 表示 了 可 行 的 通信 线路 。 


(a) Ge 的 深度 优先 生成 树 (b) Ge 的 广度 优先 生成 树 
图 6.16 连通 图 G。 的 生成 树 


图 6.17 非 连通 图 G; 的 生成 森林 


如 果 图 G 中 的 边 都 带 上 权 , 则 称 G 为 网 。 边 上 的 权 可 以 表示 两 个 城市 之 间 的 距离 ,或 
者 表示 两 个 城市 之 间 的 通信 和 网络 所 花费 的 代价 等 。 在 n 个 城市 之 间 最 多 可 建 n(n 一 1)/2 
条 线路 ,如 何在 这 些 可 能 的 线路 中 ,选择 n 一 1 条 线路 ,使 其 总 的 代价 最 小 ,或 者 线路 的 总 长 
度 最 短 呢 ? 因 为 具有 个 顶点 的 网 可 以 建立 许多 生成 树 ,每 一 棵 生成 树 都 是 一 个 通信 和 网 
络 。 按 照 生 成 树 的 定义 ,具有 个 顶点 的 网 的 生成 树 , 应 该 具有 个 顶点 和 nn 一 1 条 边 。 所 
以 ,上 面 的 问题 就 是 要 选择 一 棵 生成 树 , 使 其 总 的 代价 (或 距离 等 ) 达 到 最 小 。 即 是 构造 一 棵 
最 小 代价 生成 树 (minimum cost spanning tree, 简 称 最 小 生成 树 ) 的 问题 。 一 棵 生成 树 的 代 
价 就 是 树 上 各 边 的 权 之 和 。 

构造 最 小 生成 树 有 多 种 算法 。 本 节 只 介绍 普 里 姆 (Prim) 算 法 和 克 鲁 斯 卡尔 (Kruskal) 
算法 。 这 两 种 算法 建立 在 下 述 结论 的 基础 上 。 

N= 二 (V,E) 是 一 连通 网 ,U 是 顶点 集 V 的 一 个 非 空子 集 。 若 (u,v) 是 一 条 具有 最 小 权 
值 的 边 ,其 中 EU,v€EV 一 U, 则 必 存 在 NN 的 一 棵 包含 边 (u,v) 的 最 小 生成 树 。 

用 反 证 法 给 出 证 明 。 

证 明 : 假设 网 N 的 任何 一 棵 最 小 生成 树 都 不 包含 (wu) , 设 T 是 连通 网 的 一 棵 最 小 生 
成 树 。 将 边 (x,uw) 加 入 到 工 中 时 ,由 生成 树 的 定义 , 则 在 T 上 必然 存在 一 条 包含 (wu) 的 回 
路 。 另 外 ,由 于 工 是 生成 树 , 则 在 T 上 必然 存在 另 一 条 边 (w ,v'), 其 中 EU,v EV 一 U， 
且 w 和 ww 之 间 ,v 和 w 之 间 均 有 路 径 相通 。 删 去 边 (u ,v ) 便 可 消除 上 述 回路 ,于 是 可 得 到 
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另 一 棵 生成 树 T。 由 于 (wz) 的 权 值 不 高 于 (wx ,wv ) 的 权 值 ,所 以 的 代价 不 高 于 了 的 代 
价 。T' 是 包含 (u,v) 的 一 棵 最 小 生成 树 , 这 与 开始 的 假设 相 矛 盾 。 


1. Prim 算法 


设 N= 二 (V,E) 是 连通 网 ,T= 二 (V,E') 是 正在 构造 中 的 生成 树 。 初 始 状 态 时 ,这 棵 生成 
树 只 有 一 个 结 点 ,没有 边 , 即 U=={uo),E' 二 如 ,uo 是 任意 选 定 的 顶点 。 从 初始 状态 开始 重 
复 执行 下 列 操作 : 在 所 有 uwEU,vEV 一 U 的 边 (u,v)((u,v)EE) 中 找 出 一 条 代价 最 小 的 
边 (u ,v ) 并 入 集合 E', 同 时 v 并 入 集合 U, 直 到 V=U 为 止 。 这 时 E' 中 必 有 nn 一 1 条 边 ， 
T= 二 (U,E') 是 图 G 的 一 棵 最 小 生成 树 。 由 上 面 反 证 法 证 明 的 结论 说 明 : 用 Prim 方法 构造 
最 小 生成 树 的 过 程 是 正确 的 。 因 为 从 初始 U 包含 一 个 顶点 .E' 为 空 开始 ,每 一 步 加 进去 的 
都 是 最 小 生成 树 中 应 当 包 含 的 边 ,直到 V=U ,得 到 最 小 生成 树 工 。 另 外 在 选择 具有 最 小 权 
值 的 边 时 ,如 果 同 时 存在 几 条 具有 相同 权 值 的 边 , 则 可 以 任 选 一 条 ,因此 构造 的 最 小 生成 树 
不 是 唯一 的 ,但 是 它们 的 代价 是 相等 的 。 

图 6. 18 给 出 了 一 个 连通 网 以 及 用 Prim 算法 构造 最 小 生成 树 的 图 示 , 以 v 为 源 点 。 
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(a) 连通 网 示例 (b) Prim 算 法 构造 最 小 生成 树 第 1 步 (0) Prim 算 法 构造 最 小 生成 树 第 2 步 


(d) Prim 算 法 构造 最 小 生成 树 第 3 步 (e) Prim 算 法 构造 最 小 生成 树 第 4 步 (1) Prim 算 法 构造 最 小 生成 树 第 5 步 
图 6.18 Prim 算法 构造 一 棵 最 小 生成 树 的 过 程 


假设 连通 网 络 用 邻接 矩阵 cost 存储 ,为 了 实现 Prim 算法 ,需要 附设 两 个 辅助 数组 
lowcost(1..n)、closest(1..n), 对 每 一 个 顶点 v€EU 一 V ,lowcost[v] 二 min{cost(u,v)|u€ 
U} ,closest[Lv 存储 该 边 依附 的 在 U 中 的 项 点 。 由 于 U={1}), 则 到 V 一 U 中 各 顶点 最 小 的 
边 , 即 为 依附 于 顶点 1 的 各 边 中 ,找到 代价 最 小 的 边 (xo yuo) , 即 (xo yuo) 一 (1,3) 一 minfcost 
(12< 入 6) ,因此 ,(1,3) 为 生成 树 上 的 第 一 条 边 , 同 时 将 3 并 和 人 集合 U ,然后 修改 辅助 
数组 的 值 。 首 先 将 lowcostL3j] 改 为 '0', 以 表示 顶点 3 已 进入 U, 然 后 初始 化 lowcost[2] 王 
cost(1,2) 二 6。 当 3 并 入 UU 后 ,由 于 边 (3,2) 上 的 权 值 5 小 于 lowcost[2], 则 需 修 改 lowcost 
[2j 为 5,closestL2] 的 值 由 1 修改 为 3。 同 理 ,. 由 于 初始 时 lowcostL5]=cost(1,5) 王 ce, 则 当 
3 并 入 UU 后 ,因为 cost(3,5) 二 6, 由 此 修改 lowcost[5] 为 6,closest[5] 二 3; 同 理 修改 
lowcost[6] 为 4,closestL[6] 二 3, 以 此 类 推 ,直到 U==V。 

构造 最 小 生成 树 过 程 中 辅助 数组 lowcost、closest 中 各 分 量 的 值 变化 如 图 6. 19 所 示 。 


V 2 3 4 5 6 U = 如 输出 边 
closest 1 1 ih ’ 1 
{1} {2,3,4,5,6} 
lowcost 6 1 5 co ce 
closest 3 0 1 3 3 
{1,3} {2,4,5,6} (1,3) 
lowcost 5 0 5 6 4 
closest 3 0 6 3 0 
{1,3,6} {2,4,5} (1,3)(3,6) 
lowcost 5 0 2 6 0 
closest 3 0 0 3 0 (1,3)(3,6) 
{1,3,6,4} {2,5} 
lowcost 5 0 0 6 0 (6,4) 
closest 0 0 0 2 0 (1,3)(3,6) 
{1,3,6,4,2} {5} 
lowcost 0 0 0 3 0 (6,4)(3,2) 
closest 0 0 0 0 0 (1,3)(3,6) 
{1,3,6,4,2,5}) {} 
loweost 0 0 0 6 0 (6,4)(3,2)(2,5) 


图 6.19 构造 最 小 代价 生成 树 过 程 中 辅助 数组 各 分 量 值 的 变化 


算法 6.8 求 最 小 生成 树 Prim 算法 。 


#definen... // 网 的 项 点数 
# define maxi ... // 网 中 权 的 最 大 值 小 于 maxi 
typedef ;int costtype[n+1][n+1]; // 下 标 从 1 开始 


void prim(costtype cost) 


int lowcost[n+1]; 


int closest[n+1]; 


int i,j,k,min; 
for(i=2;i<=n;i+t+) 


{ 


} 


lowcost[i] = cost[1][i]; 
closest[i] =1; 


for(i=2;i<=n;it+) // 寻 找 iEu,kEv-u, 且 边 {i,k} 的 权 值 最 小 


{ 


min = maxi; 
k=0; 
for(j=2;j<=n;j++) 
if( (lowcost[j]<min)g&&(lowcost[j]!= 0)) 
{ 
min= lowcost[j]; 
k=j; 
L 
printf("#% dg 5d",k,closest[k]); ”// 输 出 生成 树 的 边 


lowcost[k] = 0; //k 加 入 u 

closest[k] = 0; 

for(j=2;j<=n;j+t+) // 调 整 代价 
if((cost[k][j]< lowcost[j])&&(closest[k][j]!'= 0)) 
{ 


lowcost[j] = cost[k][j]; 
closest[j] =k; 
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显然 Prim 算法 的 时 间 复 杂 度 为 O(n*), 其 中 为 网 中 顶点 的 个 数 ,与 网 中 的 边 数 无 
关 , 因 此 Prim 算法 适用 于 求 边 稠 密 的 网 的 最 小 生成 树 。 


2. Kruskal 算法 


Kruskal 算法 从 另 一 途径 求 网 的 最 小 生成 树 。 假 设 连通 网 N= 二 {V,E), 令 最 小 生成 树 
的 初始 状态 为 只 及 个 顶点 而 无 边 的 非 连通 图 T= 二 (V ,名 ), 图 中 每 一 个 顶点 自 成 一 个 连通 
分 量 。 在 EE 中 选择 权 最 小 的 边 ,车 此 边 依附 的 顶点 落 在 了 中 不 同 的 连通 分 量 上 , 则 将 此 边 
加 入 到 工 中 ; 否则 使 去 此 边 ,选择 下 一 条 代价 最 小 的 边 ; 以 此 类 推 ,直到 T 中 所 有 的 顶点 
都 在 同一 连通 分 量 为 止 。 

例如 ,图 6. 20 所 示 为 Kruskal 算法 构造 一 棵 最 小 生成 树 的 过 程 。 图 6. 20(a) 是 一 个 网 
的 示例 , 设 此 网 是 用 边 集 数组 表示 的 , 且 数 组 中 各 边 是 按 权 值 从 小 到 大 的 顺序 排列 的 ,如 
图 6. 20(b) 所 示 。 若 元 素 不 是 有 序 排列 的 , 则 可 通过 调用 排序 算法 ,使 之 有 序 。 因 此 ,算法 
要 求 按 权 值 从 小 到 大 的 次 序 选取 各 边 ,就 转换 成 按 边 集 数组 中 下 标 次 序 选 取 各 边 。 当 选取 
前 三 条 边 时 , 均 不 产生 回路 ,应 保留 作为 生成 树 T 的 边 , 如 图 6. 20(c) 所 示 ; 选取 第 四 条 边 
(2,3) 时 ,将 与 已 保留 的 边 形成 回路 ,应 舍 去 ; 接着 保留 (1,5) 边 , 舍 去 (3,5) 边 ; 取 到 (0,1) 
边 并 保留 后 ,保留 的 边 数 已 够 5 条 ( 即 n 一 1 条 ), 此 时 必定 将 全 部 六 个 顶点 连通 起 来 ,如 
图 6.20(d) 所 示 , 它 就 是 图 6. 20(a) 的 最 小 生成 树 。 


3 ; 
4 @) 8 
四 
(a) 网 的 示例 (c) 含 三 条 边 的 最 小 生成 树 
0 1 2 3 4 5 6 7 8 
fromvex| 0 | 1 2 | 1 入 0 3 0 4 
endvex| 4 | 2 | 3 | 3 | 5 |5|1|14151|5 
weight| 4 | 5|s|10|1211s|18|20| 2 | 25 


(b) 网 的 边 集 数组 存储 结构 
图 6.20 Kruskal 算法 构造 一 棵 最 小 生成 树 的 过 程 


实现 Kruskal 算法 的 关键 之 处 是 : 如 何 判 断 欲 加 入 了 中 的 一 条 边 是 否 与 生成 树 中 已 保 
留 的 边 形成 回路 ?这 可 通过 将 各 顶点 划分 为 不 同 集合 的 方法 来 解决 ,每 个 集合 中 的 顶点 表 
示 一 个 无 回路 的 连通 分 量 。 算 法 开始 时 ,因为 生成 树 的 顶点 集 等 于 图 G 的 顶点 集 , 边 集 为 
空 , 所 以 n 个 顶点 分 属于 n 个 集合 ,每 个 集合 中 只 有 一 个 顶点 ,表明 顶点 之 间 互 不 连通 。 例 
如 对 于 图 6. 20, 其 六 个 集合 为 : {0},{1},{2},{3},{4}),{5}。 

当 从 边 集 数 组 中 按 次 序 选取 一 条 边 时 ,车 它 的 两 个 端点 分 属于 不 同 的 集合 , 则 表明 此 边 
连通 了 两 个 不 同 的 连通 分 量 。 因 每 个 连通 分 量 无 回路 ,所 以 连通 后 得 到 的 连通 分 量 仍 不 会 
产生 回路 。 此 边 应 保留 作为 生成 树 的 一 条 边 ,同时 把 端点 所 在 的 两 个 集合 合并 成 一 个 , 即 成 
为 一 个 连通 分 量 。 当 选取 的 一 条 边 的 两 个 端点 同属 于 一 个 集合 时 ,此 边 应 放弃 , 因 同 一 个 集 
合 中 的 顶点 是 连通 无 回路 的 ,车 再 加 入 一 条 边 则 必 产 生 回路 。 在 上 述 例子 中 ,当选 取 (0,4)、 


(1,2)、(1,3) 这 三 条 边 后 ,顶点 的 集合 则 变 成 如 下 三 个 : {0,4},{1,2,3),{5})。 

下 一 条 边 (2,3) 的 两 端点 同属 于 一 个 集合 , 故 舍 去 。 再 下 一 条 边 (1,5) 的 两 端点 属于 不 
同 的 集合 ,应 保留 ,同时 把 两 个 集合 {1,2,3)} 和 {5) 合 并 成 一 个 {1,2,3,5)。 以 此 类 推 ,直到 所 
有 项 点 同属 于 一 个 集合 , 即 进行 了 nn 一 1 次 集合 的 合并 ,保留 了 nn 一 1 条 生成 树 的 边 为止 。 

下 面 用 C 语言 编写 出 Kruskal 算法 的 具体 实现 。 算 法 遵循 下 述 约定 : 

(1) 设 ge 是 具有 edgeset 类 型 的 边 集 数组 ,并 假定 每 条 边 是 按照 权 值 从 小 到 大 的 顺序 
存放 的 ; 

(2) 设 c 是 具有 edgeset 类 型 的 边 集 数组 ,用 该 数组 存储 依次 所 求 得 的 生成 树 中 的 每 一 
条 边 ; 

(3) 在 算法 内 部 定义 了 一 个 int parent[ ] 数 组 ,parent[i] 记 录 i 结 点 在 同一 个 集合 的 双 
亲 结 点 ,以 便 查找 i 所 在 集合 号 。 

算法 6.9 求 最 小 生成 树 Kruskal 算法 。 

// 利 用 Kruskal 算法 求 边 集 数组 ge( 按 权 值 递增 存储 ) 表 示 图 的 最 小 生成 树 ,结果 存放 在 边 集 数 组 c 中 

int Find(int * parent, int f) // 找 荆 结 点 的 集合 号 

while (parent[f]> 0) 

f = parent[f]; 


return f; 
J 
void kruskal (edgeset ge[ ], edgeset c[], int n) 
{ 

int i; 

int parent[nmax + 1]; 


for (i=1; i<=n; i++) // 初 始 化 ,每 个 结 点 二 自 成 一 集合 ,集合 号 为 i 
parent[i] = i; 
int k=1; //k 表示 待 获取 的 最 小 生成 树 中 的 边 数 , 初 值 为 1 
int d=1; //d 表示 ge 中 待 扫描 边 元 素 的 下 标 位 置 , 初 值 为 1 
int ml, m2; //m1l,m2 用 来 分 别 记录 一 条 边 的 两 个 顶点 所 在 集合 的 序号 


printf(" 最 小 生成 树 为 :\n"); 

while (k<n) 

{ // 进 行 n-1 次 循环 ,得 到 最 小 生成 树 中 的 n-1 条 边 
ml = Find(parent, ge[d]. begin); 
m2 = Find(parent, ge[d].end); 


证 (ml!= m2) // 该 边 两 个 顶点 属于 不 同 集合 ,加 入 不 会 构成 回路 
{ 
parent[m1] = m2; // 两 个 集合 合并 
c[k] = ge[d]; 
tts 
} 
d++; 
} 
} //end 


例如 , 若 利用 图 6. 20(b) 所 示 的 边 集 数组 调用 此 算法 , 则 最 后 得 到 最 小 生成 树 的 边 集 数 
组 如 表 6. 1 所 示 。 
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表 6.1 图 6.20(b) 所 示 图 的 最 小 生成 树 的 边 集 数 组 


€ 1 2 3 4 5 
fromvex 0 1 1 1 0 
endvex 4 2 3 5 1 
weight 4 5 8 12 18 


(6.5 有 向 无 环 图 及 应 用 
A 


一 个 无 环 (无 回路 ) 的 有 向 图 叫 作 有 向 无 环 图 (Directed Acycline Graph,DAG) 。 

有 向 图 是 描述 一 项 工程 或 系统 进行 过 程 的 有 效 工 具 。 一 项 工程 常常 可 以 分 成 若干 个 子 
工程 (活动 ) ,要 完成 整个 工程 必须 完成 所 有 子 工程 。 这 些 子 工程 的 执行 往往 伴随 着 某 些 先 
决 条 件 , 例 如 , 某 些 子 工程 必须 先 于 另 一 些 子 工程 完成 。 对 于 整个 工程 来 说 ,人 们 最 关心 的 
是 两 个 方面 的 问题 : 一 是 工程 能 和 否 顺利 进行 ; 二 是 估算 整个 工程 完成 所 必需 的 最 短 时 间 。 
如 果 利 用 有 向 图 作为 模拟 问题 的 数学 模型 ,这 两 个 方面 的 问题 就 转化 成 在 有 向 图 上 进行 拓 
扑 排 序 (topological sort) 和 求 关 键 路 径 (critical path)。 


6.5.1 拓扑 排序 


下 面 介 绍 一 些 基本 概念 。 

二 元 关系 (two-place relation) : 如 果 一 个 集合 R 的 元 素 都 是 有 序 对 (a ,5) ,其 中 ,bE 
XX, 则 称 这 个 集合 R 是 X 上 的 一 个 二 元 关系 。 用 一 个 代表 集合 的 符号 R 作为 这 个 关系 的 
符号 。 对 于 二 元 关系 及 ,如 果 (e ,ER , 则 记 作 aRb ,如 果 45,a)ER, 则 记 作 5bRa。 

设 尺 是 X 上 的 关系 , 则 有 : 

自 反 关系 (reflexive relation) : 如 果 对 于 任意 的 zEX 都 有 zxzRz. 则 称 R 是 X 上 的 自 
反 关 系 。 

反对 称 关系 (antisymmetric relation) : 对 于 任意 的 a.5EX ,如 果 aRb 有 目 bRa, 则 有 a= 
5 ,就 称 R 为 X 上 的 反对 称 关系 。 

传递 关系 (transitive relation) : 对 于 任意 的 a,b,cEX, 若 有 aRb,bRe, 则 必 有 aRc ,就 
称 尺 是 X 上 的 一 个 传递 关系 。 

偏 序 关 系 (partial ordering relation) : 车 RR 是 自 反 的 ,反对 称 的 和 传递 的 , 则 称 R 是 XX 
上 的 一 个 偏 序 关系 。 

全 序 关 系 (complete ordering relation) : 如 果 对 每 个 a.5EX, 必 有 aRb 或 pRa , 则 称 尺 
是 X 上 的 一 个 全 序 关系 。 

拓扑 排序 : 由 一 个 集合 上 的 偏 序 得 到 该 集合 上 的 一 个 全 序 的 操作 过 程 称 为 拓扑 排序 。 
拓扑 排序 是 一 种 对 非 线 性 结构 的 有 向 图 进行 线性 化 的 重要 手段 。 

直观 地 看 , 偏 序 指 集合 中 仅 有 部 分 元 素 之 间 可 以 比较 ,而 全 序 指 集合 中 全 体 元 素 之 间 均 
可 比较 。 例 如 图 6. 21 所 示 的 两 个 有 向 图 。 图 中 弧 (z,y) 表 示 x 三 y (符号 三 表示 x 领先 于 
y) ,RR 的 含义 就 是 领先 。 图 6. 21(a) 表 示 偏 序 ,图 6. 21(b) 表 示 全 序 。 若 在 图 6. 21(a) 的 有 
向 图 上 人 为 地 加 上 一 个 表示 2 二 3 的 弧 , 则 图 6. 21(a) 表 示 的 就 为 全 序 , 且 这 个 从 偏 序 到 全 
序 的 操作 过 程 是 拓扑 排序 ,而 这 个 全 序 称 为 拓扑 有 序 (topological order) 。 


© 
© ® EOD 
© 
(a) 偏 序 (b) 全 序 


图 6.21 表示 偏 序 和 全 序 的 有 向 图 


一 个 表示 偏 序 的 有 向 图 可 以 用 于 表示 一 个 施工 流程 图 或 者 一 个 产品 生产 的 流程 图 等 。 
图 中 每 一 条 有 向 边 表示 两 个 活动 之 间 的 次 序 关系 (领先 关系 )。 用 顶点 表示 活动 ,用 弧 表 示 
活动 之 间 的 优先 关系 的 有 向 图 , 称 为 项 点 表示 活动 的 网 ,简称 AOV 网 。 在 网 中 , 若 从 顶点 i 
到 顶点 j 有 一 条 有 向 路 径 , 则 i 是 7 的 前 驱 ,) 是 i 的 后 继 。 若 (i,j) 是 网 中 的 一 条 弧 , 则 i 是 
的 直接 前 驱 ,j 是 i 的 直接 后 继 。 

例如 ,一 个 软件 专业 的 学 生 必须 学 完 一 系列 规定 的 基本 课程 。 这 一 事件 可 以 看 作 一 项 工 
程 ,其 中 ,把 学 习 每 一 门 课 看 作 一 项 子 工 程 。 由 于 某 些 课程 是 基础 课 , 而 另 一 些 课程 必须 在 学 
完 它们 规定 的 先行 课 后 ,才能 开始 学 习 , 这 样 就 规定 了 课程 之 间 的 领先 关系 。 这 个 关系 是 建立 
在 课程 之 上 的 一 个 偏 序 关 系 。 现 假定 软件 专业 的 课程 之 间 的 这 种 偏 序 关系 如 表 6. 2 所 示 。 


表 6.2 软件 专业 课程 之 间 的 偏 序 关系 


课程 编号 课程 名 称 先决 条 件 

Ci 程序 设计 基础 无 

C: 离散 数学 es 

Cs 数据 结构 Cv 
C， 汇编 语言 i 

Cs 程序 设计 语言 原理 EY 
es 计算 机 组 成 原理 i 
C， 编译 原理 iD 
Cs 操作 系统 

高 等 数学 

Cw 线性 代数 

Cu 普通 物理 

Ci 数值 分 析 


利用 有 向 图 可 以 把 这 种 偏 序 关 系 清楚 地 表示 
成 AOV 网 。 网 中 结 点 表示 课程 代号 ,有 向 边 代 表 
领先 条 件 。 当 且 仅 当 课程 C; 领先 于 课程 C; 时 ,网 
中 才 有 一 条 弧 , 如 图 6. 22 所 示 。 

如 果 再 规定 一 个 学 生 每 学 期 只 修一 门 课 , 则 
按 图 6. 22 ,教学 进程 是 否 能 顺利 进行 呢 ? 这 需要 
对 图 6. 22 中 的 AOV 网 做 测试 ,网 中 是 否 存在 着 
有 向 环 ? 如 果 不 存在 有 向 环 , 则 可 得 到 各 课程 的 
一 个 线性 序列 ,教学 进程 能 顺利 进行 ; 否则 ,不 能 (Cy 


进行 。 图 6. 22 ”表示 课程 间 偏 序 关系 的 AOV 网 
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回顾 无 向 图 中 检测 是 否 存在 环 的 方法 。 

(1) 对 于 无 向 图 来 说 , 若 深度 优先 遍历 过 程 中 遇 到 回 边 ( 即 指向 已 访问 过 的 顶点 的 边 ) ， 
则 必定 存在 环 。 

(2) 对 于 有 向 图 来 说 ,检查 是 否 存在 有 向 环 则 更 为 复杂 。 在 有 向 图 中 ,这 条 回 边 有 可 能 
是 指向 深度 优先 生成 森林 中 另 一 棵 生成 树 上 项 点 的 弧 。 但 是 ,如 果 从 有 向 图 上 某 个 顶点 v 
出 发 开始 遍历 ,在 DFSCv) 结 束 之 前 出 现 一 条 从 x 到 vw 的 回 边 ,由 于 在 生成 树 上 是 v 的 子 
孙 , 则 有 向 图 中 必定 存在 包含 顶点 v 和 的 环 , 这 是 一 种 方法 。 

下 面 介绍 在 AOV 网 上 检查 是 否 存在 有 向 环 的 另 一 有 效 方法 : 对 有 向 图 构造 其 顶点 的 
拓扑 有 序 序列 , 若 网 中 所 有 顶点 都 在 它 的 拓扑 有 序 序列 中 , 则 AOV 网 中 必定 不 存在 有 
向 环 。 

例如 图 6. 22 的 AOV 网 有 如 下 两 个 拓扑 有 序 序列 : 

CllCCrCrC Cm Cn Cn Gs 
CCC CC CC CC 

对 此 图 也 可 构造 其 他 的 拓扑 序列 ,但 是 教学 进程 必须 按 某 一 拓扑 序列 进行 ,才能 得 以 顺 

人 


(1) ei ee 它 输出 。 

(2) 从 图 中 删除 该 项 点 和 所 有 以 它 为 尾 的 弧 。 

(3) 重复 步骤 (1) 和 步骤 (2) ,直至 全 部 顶点 均 已 被 输出 ,或 者 当前 图 中 不 存在 无 前 驱 的 
顶点 为 止 ,后 一 种 情况 说 明 有 向 图 中 存在 有 向 环 。 

以 图 6.23(a) 中 的 有 向 图 为 例 。 图 中 w 、vs 没有 前 驱 , 则 可 任 选 一 个 ,假设 先 输出 ws ， 
在 删除 ws 以 及 以 us 为 尾 的 弧 (us ,v4)、《vs ,vs) 之 后 , 余 留 的 图 为 图 6. 23(b)。 在 图 6. 23(b) 
所 示 的 有 向 图 中 ,只 有 wv 没有 前 驱 , 则 输出 w 且 删 除 wm 及 弧 (uwi vs》、《visvs) 和 《vi ,v4)， 
得 到 的 余 图 为 图 6.23(c)。 在 图 6.23(c) 所 示 的 有 向 图 中 ,vs 、vs 没有 前 驱 。 以 此 类 推 ,可 以 
从 中 任 选 一 个 继续 进行 。 整 个 拓扑 排序 的 过 程 如 图 6. 23 所 示 ,最 后 得 到 该 有 向 图 的 拓扑 有 
序 序列 是 : ve ,vi ,vssvs3,vs,vs。 它 包含 了 图 中 所 有 的 顶点 ,所 以 图 6.23(a) 中 的 有 向 图 不 
含有 向 环 。 这 样 , 非 线性 结构 的 有 向 图 图 6. 23(a) 被 线性 化 为 拓扑 有 序 序列 。 
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图 6.23 AOV 网 及 其 拓扑 有 序 序列 的 产生 过 程 


用 程序 如 何 实现 构造 有 向 图 的 拓扑 有 序 序列 呢 ? 首先 要 明确 有 向 图 的 存储 结构 。 存 储 
结构 的 选择 取决 于 将 要 执行 的 基本 操作 。 在 拓扑 排序 算法 中 ,主要 操作 包括 : 

(1) 决定 一 个 结 点 是 否 有 前 趋 ( 入 度 为 零 ) 的 项 点。 

(2) 删除 一 个 结 点 以 及 所 有 以 它 为 尾 的 弧 。 


显然 ,采用 邻接 表 在 这 里 会 更 为 有 效 。 

如 果 对 每 个 顶点 的 前 驱 给 以 计数 ,操作 (1) 就 很 容易 实现 ; 操作 (2) 在 用 邻接 表 时 会 比 
用 邻接 矩阵 更 有 效 。 因 为 在 邻接 矩阵 的 情况 下 ,必须 处 理 与 该 顶点 有 关 的 整 行 元 素 (” 个 )， 
而 邻接 表 只 需 处 理 在 邻接 矩阵 中 非 零 的 那些 邻接 点 。 另 外 ,在 邻接 表 的 表 头 结 点 增加 一 个 
存放 顶点 入 度 的 域 。 因 此 ,在 输出 AOV 网 的 有 向 边 之 前 , 表 头 结 点 的 初 态 为 : 存放 顶点 人 
度 的 域 置 成 零 ,指针 域 为 空 。 每 输入 一 条 有 向 边 (i,j) 时 ,在 第 i 个 链表 中 建立 一 个 结 点 , 同 
时 将 顶点 7 的 入 度 加 1。 这 样 ,在 输入 结束 时 , 表 头 结 点 的 两 个 域 分 别 表示 顶点 的 入 度 和 指 
向 链表 的 第 一 个 结 点 。 图 6. 23(a) 建 立 的 邻接 表 如 图 6. 24 所 示 。 


[| w | 0 =| 4 -|3 -|2 
| ow | 2 

vs 1 一 二 一 ~| 5 | 才 --| : 

Ua 2 一 -一 一 | 5 
[| 

| 0 


图 6.24 图 6.23(a) 的 邻接 表 


在 拓扑 排序 的 过 程 中 , 当 某 个 顶点 的 入 度 为 零 时 ,就 将 此 顶点 输出 ,同时 将 该 项 点 的 所 
有 直接 后 继 的 人 度 减 1。 为 了 避免 重复 检测 入 度 为 零 的 顶点 ,需要 设 一 个 栈 , 用 来 存放 入 度 
为 零 的 项 点 。 因 此 ,拓扑 排序 的 算法 描述 如 下 : 

(1) 输入 图 的 有 向 边 , 建 立 邻 接 表 。 

(2) 查找 邻接 表 中 入 度 为 零 的 顶点 ,把 入 度 为 零 的 顶点 进 栈 。 

(3) 当 栈 不 空 时 , 则 

J@ 使 用 退 栈 操作 ,取得 栈 顶 元 素 j ,并 输出 j。 

@ 在 邻接 表 中 ,查找 j 的 所 有 后 继 &, 将 & 的 入 度 减 1; 车 k 的 入 度 为 零 , 则 进 栈 ,再 


转 (3)。 

(4) 当 栈 空 时 ,车 有 向 图 的 所 有 顶点 都 已 输出 , 则 拓扑 排序 过 程 结束 ,否则 ,说 明 图 中 存 
在 有 向 环 。 

算法 6.10 拓扑 排序 算法 。 

#define N7 // 图 中 顶点 个 数 的 最 大 值 


#define NULL 0 
# define LEN sizeof(struct arcnode) 
struct arcnode 
{ 
int adjvex; 
struct arcnode * nextarc; 
}; 
struct vexnode 
{ 
int vexdata; 
int indegree; 
struct arcnode * firstarc; 
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}; 
void crt_adjlist(struct vexnode dig[ ]) 
下 


struct arcnode *p; 


int k,m, i; 
for(i=1;i<= N;it+) 
{ 


dig[i]. vexdata = i; 
dig[i].firstarc = NULL; 
dig[i]. indegree = 0; 
} 

printf("\nplease input the arc\n"); 

scanf("% ds%d", gk, gm); 

while(! (k== 0&&m== 0)) 

{ 


// 读 入 有 向 边 ,建立 图 G 的 邻接 表 


// 表 头 结 点 初始 化 


//Ak 为 弧 尾 ,为 弧 头 
// 生 成 邻接 表 , 表 头 结 点 的 degree 域 为 每 个 顶点 的 入 度 


p= (struct arcnode * )malloc(LEN); 


p->adjvex= m; 


p->nextarc= dig[k].firstarc; 


dig[k]. firstarc=p; 
dig[m]. indegreet+; 
scanf(" % dg%d", gk, gm); 
} 
} 
void topsort( struct vexnode dig[ ]) 
{ 
int m, i,j,top,k, stack[N]; 
struct arcnode * q; 
top= —1; 
for(i=1;i<=N;it+) 
if(dig[i]. indegree == 0) 
stack[++top] = i; 
m= 0; 
while (top!= -1) 
| 
j= stack[top—— ]; 


printf(" % 5d", dig[j]. vexdata); 


mt 二 
q= dig[j].firstarc; 
while( q!= NULL) 
{ 
k= q->adjvex; 


if( -- dig[k]. indegree == 0) 


stack[++top] = k; 
q=q->nextarc; 
} 
} 


// 新 的 弧 结 点 插入 在 单 链表 的 表 头 


// 和 信 度 加 1 


1/ 拓扑 排序 


// 栈 初始 化 
// 人 度 为 零 的 顶点 进 栈 


// 输 出 顶点 的 计数 器 
// 栈 不 空 


//i 取 栈 项 元 素 , 栈 项 元 素 退 栈 


// 在 邻接 表 上 查找 j 的 所 有 后 继 k, 将 k 的 入 度 减 1 


// 若 上 的 入 度 为 零 , 让 k 进 栈 


if(m<N) printf("the graph has recycle"); 


分 析 上 面 的 算法 可 知 ,如 果 网 中 及 个 顶点 e 条 弧 , 则 建立 邻接 表 时 需要 时 间 复 杂 
为 Ol(e)。 在 拓扑 排序 中 ,查找 入 度 为 零 的 顶点 需要 时 间 复 杂 度 为 O(n), 顶 点 进 栈 及 输出 


共 执行 a 次 ,入 度 减 1 的 操作 要 执行 。 次 ,所 以 总 的 时 间 复 杂 度 为 O(n 十 e)。 
6.5.2 关键 路 径 


AOV 网 是 一 种 以 顶点 表示 活动 、 弧 表示 活动 之 间 的 优先 关系 的 有 向 图 。 与 AOV 网 相 
对 应 的 还 有 一 种 AOE 网 , 它 以 顶点 表示 事件 , 弧 代 表 活 动 , 权 表 示 活 动 需要 的 时 间 。 顶 点 
所 代表 的 事件 表示 : 所 有 以 它 为 弧 头 的 弧 代 表 的 活动 已 完成 ,所 有 以 它 为 弧 尾 的 弧 代 表 的 
活动 可 以 开始 。AOE 网 可 用 于 估算 一 项 工程 的 完成 时 间 。 图 6. 25 中 的 AOE 网 表示 一 个 
有 11 项 活动 和 9 个 事件 的 工程 。 其 中 事件 w 表示 整个 工程 的 开始 ,事件 v。 表示 整个 工程 
结束 ,每 个 事件 v; G 一 2,…,8) 表 示 它 之 前 的 所 有 活动 都 已 经 完成 ,在 它 之 后 的 活动 可 以 开 
始 这 样 一 个 事实 。 例 如 顶点 ws 表示 活动 a, as 已 经 完成 ,于 是 ay as 可 以 开始 。wi=6, 表 
示 该 活动 需要 6 天 的 时 间 ,a* 一 4 表示 该 活动 需要 4 天 时 间 。 


图 6.25 一 个 AOE 网 


由 于 整个 工程 通常 只 有 一 个 开始 点 和 一 个 完成 点 ,所 以 在 正常 情况 (无 环 ) 下 ,网 中 只 有 
一 个 人 度 为 零 的 点 , 称 为 源 点 ; 一 个 出 度 为 零 的 点 , 称 为 汇 点 。 

与 AOV 网 不 同 ,AOE 网 需要 解决 的 问题 是 : 

(1) 完成 整个 工程 至 少 需要 的 时 间 。 

(2) 确定 哪些 活动 是 影响 工程 进度 的 关键 。 

由 于 在 AOE 网 中 ,有 些 活动 可 以 并 行进 行 ,所 以 完成 整个 工程 的 最 短 时 间 是 从 源 点 到 
汇 点 的 最 长 路 径 的 长 度 (路 径 长 度 等 于 路 径 上 各 边 的 权 之 和 ,而 不 是 路 径 上 弧 的 数目 )。 这 
条 具有 最 大 长 度 的 路 径 称 为 关键 路 径 。 例 如 ,图 6. 25 中 (wi ,vs ,us ,vi ,vs ) 就 是 一 条 长 度 为 
18 的 关键 路 径 , 这 代表 整个 工程 至 少 需要 18 天 才能 完成 。 一 个 AOE 网 可 以 有 多 条 关键 路 
径 , 如 (vi ,vs,vs ,vs,vs) 也 是 图 6. 25 所 示 的 AOE 网 的 一 条 关键 路 径 , 它 的 长 度 为 18。 

关键 路 径 上 所 有 活动 都 是 关键 活动 。 为 了 找到 关键 路 径 , 需 要 先 定义 几 个 量 。 

(1) 事件 v; 的 可 能 的 最 早 发 生 时 间 ee(i) ,是 从 源 点 到 顶点 v; 的 最 长 路 径 长 度 。 

(2) 事件 w 的 允许 的 最 晚 发 生 时 间 le(i) ,是 保证 完成 汇 点 v, 在 ee(n) 时 刻 发 生 的 前 
提 下 ,事件 w 允许 发 生 的 最 晚 时 间 。 它 等 于 ee(n) 减 去 v; 到 vw, 的 最 长 路 径 的 长 度 。 

(3) 活动 a, 二 (vi;,vj) 的 可 能 的 最 早 开 始 时 间 e(k) ,等 于 事件 w 可 能 的 最 早 发 生 时 间 
ee(i), 

(4) 活动 ws 一 (ui ui 的 可 能 的 最 晚 完 成 时 间 1(k) ,等 于 事件 w 允许 的 最 晚 发 生 时 间 
le(j)。 
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因此 1(k) 一 e(k) 是 活动 a4 的 最 大 可 利用 时 间 。 如 果 一 个 活动 的 最 大 可 利用 时 间 等 于 
边 a 上 所 带 的 权 ww(k), 则 a 是 关键 活动 。 这 说 明 ax 必须 在 它 的 最 早 开始 时 间 e(k) 立 即 
开始 , 毫 不 拖延 ,才能 保证 不 影响 事件 w。 在 ee(n) 时 完成 ,否则 由 于 ax 的 延误 会 引起 整个 
工程 延期 。 若 1(k) 一 e(k)> w(k), 则 ax 不 是 关键 活动 ,ax 的 完成 时 间 如 果 超 过 计划 时 间 ， 
只 要 不 超出 最 大 可 利用 时 间 , 则 整个 工程 仍 能 如 期 完工 。 

可 以 通过 以 下 步骤 求 关 键 路 径 , 设 a 二 4v;,v;) 上 的 权 w(k) 二 w(i,7), 则 : 

(1) 从 ee(1) 王 0 开始 向 前 递 推 求 ee(j ) 。 

ee(j ) 一 max{ee(i) 十 mw 人 ijJ)} 2<j<n 《6.3) 

《visv;)ET, 其 中 工 是 所 有 以 v; 为 头 的 弧 的 集合 。 

(2) 从 le(n) 二 eeln) 开 始 向 后 递 推 求 le(i)。 

le(i)=min{leQ)—w(i,j)} 1 委 1i 委 2 一 1 (6.2) 

《visvj)ES, 其 中 S 是 所 有 以 v; 为 尾 的 弧 的 集合 。 

这 两 个 递 推 公式 的 计算 必须 在 拓扑 有 序 和 逆 拓 扑 有 序 的 前 提 下 进行 。 即 在 计算 ee(j) 
时 ,要 求 顶 点 w 的 所 有 前 驱 顶 点 的 最 早 发 生 时 间 已 经 求 得 ; 在 计算 leGz) 时 ,要 求 顶 点 w 的 
所 有 后 继 顶 点 的 最 晚 发 生 时 间 已 经 求 得 。 所 以 拓扑 排序 是 它们 的 基础 。 

(3) 对 于 每 条 边 we 二 《vi; ,wv;), 求 e(k) 和 1(k)。 

e(R) 一 ee(i) ,1(k) 二 le(j) ,1 二 km ,m 为 图 中 的 边 数 。 

若 1(k) 一 e(k) 二 w(k), 则 a 是 关键 活动 。 

这 三 步 的 实现 细节 如 下 。 

(1) 计算 eeQj) ,1 和 7) 委 "。 

计算 ee(j ) 的 过 程 可 以 在 拓扑 排序 的 过 程 中 进行 。 只 需 对 算法 6. 10 做 一 些 修改 ,就 可 
以 完成 对 ee(j ) 的 计算 。 

Oa 在 邻接 表 中 ,对 第 i 条 链表 中 的 边 结 点 w 增加 一 个 weight 域 ,存储 (wu >》 上 的 
权 值 。 

@ 增加 一 个 ee[1..n] 数 组, 它 的 初 值 为 0。 

@ 算法 6. 10 的 crt_adjlist() 函 数 中 ,将 输入 语句 “scanf("%d%d",&k,&m);” 改 为 
“scanf("%d%d%d" ,Ck Em, LCw);"”, 其 中 ww 是 有 向 边 (k,m) 上 的 权 。 

@ 在 算法 6. 10 的 topsort() 函数 中 的 语句 


if( -- dig[k]. indegree == 0) stack[++top] = k; 
之 后 ,插入 语句 : 


if(ee[k]< ee[j] +q-> weight) 

ee[k] =ee[j] + q—-> weight; 

就 可 以 了 。 

(2) 计算 le(i) ,1 入 ;和 。 

由 于 在 计算 le( 让 之 前 ,已 按 修改 过 的 拓扑 排序 算法 求 出 了 ee(i) ,并 同时 得 到 了 顶点 的 
拓扑 排序 序列 。 此 时 ,只 要 把 这 个 拓扑 序列 倒 排 一 下 ,就 得 到 顶点 的 逆 拓 扑 序列 。 因 此 在 算 
法 6.10 中 的 语句 “printf("%5d", dig[jj. vexdata);” 之 后 ,插入 语句 “topl 二 topl 十 1; 
s[top1] 二 j;”, 这 里 s 是 另外 一 个 辅助 栈 , 按 拓扑 排序 存储 输出 顶点 w ,topl 是 s 的 栈 顶 指 
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针 。 于 是 只 要 将 这 个 辅助 栈 s 中 的 顶点 输出 就 是 项 点 的 逆 拓 扑 序列 。 利 用 原来 的 邻接 表 直 
接 用 式 (6. 2) 计 算 leGi ) 。 具 体 算法 如 下 。 

@ 增加 一 个 le[1..n] 数 组 , 它 的 初 值 为 ee[Lz] 。 

@ 在 topsort() 函 数 的 最 后 增加 这 样 一 些 语句 序列 : 


while (topl!= -1) // 当 栈 s 不 空 时 
{j= s[topl—— ]; //s 的 栈 顶 元 素 退 栈 
p= dig[j].firstarc; 
while (p) 


{ k=p->adjvex; 
if (le[k] -p-> weight<le[j]) 
le[j] = le[k] - p-> weight; 
p=p->nextarc; 
} 
} 
(3) 计算 eC(k) 和 71(k),1 志 k 声 m。 
求 得 ee(i) 和 le(j) 之 后 ,eCk) 和 (k) 的 计算 则 比较 容易 进行 。 增 加 辅助 数组 e[1..m]、 
LL1..mj。 设 a 二 (vi,v;),e(k) 二 ee(i),L(k) 二 le(j )。 对 每 条 统计 算 e(k) LC(k) 可 采用 : 
for(i=1;i<=m;i+t+) 
{eli]=0; 1[i]=0;}; // 数 组 e,1 初始 化 
k=1; 
for(i=1;i<=n;it+) 
{ p=dig[il].firstarc; j=p->adjvex; 
while (p) 
{ e[k] =ee[i]; 
1[k] = le[j]; 
if(1[k] - e[k] == p-> weight) 
printf("<%d, %d> is acritical activity\n", i,j); 
k++; 
p=p->nextarc; 
j=p->adjvex; 


} 


通过 上 面 (1)、(2)、(3) 可 以 求 得 AOE 网 的 关键 活动 。 

图 6.25 中 的 AOE 网 的 关键 活动 是 a ,a,， ® 
arsassawran。 从 图 中 删 去 所 有 非 关 键 活动 就 得 al a 
到 了 图 6. 26 所 示 的 有 向 图 。 @ 

在 这 个 图 中 ,从 v 到 vw。 的 路 径 都 是 关键 
路 径 。 

例如 ,对 图 6. 27(a) 所 示 的 网 ,其 计算 结果 如 图 6.26 图 6.25 的 关键 路 径 
图 6.28 所 示 , 可 见 a,、as 和 a; 为 关键 活动 ,组 成 了 一 条 从 源 点 到 汇 点 的 关键 路 径 ,如 
图 6. 27(b) 所 示 。 

并 不 是 加 快 任何 一 个 关键 活动 都 可 以 缩短 整个 工程 的 完成 时 间 , 只 有 加 快 那些 包含 在 
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顶点 ee le 活动 e 1-e 
vl 0 0 | wm 0 1 1 
TY 4 4 0 0 0 0 
Us 2 2 | a 3 4 1 
Us 6 6 | a 3 4 1 
vs 6 7 | a 2 2 0 
vse 8 8 | mw 2 5 3 

07 6 6 0 

as 6 7 1 


图 6.28 图 6.27 所 示 AOE 网 中 顶点 发 生 时 间 和 活动 的 开始 时 间 


所 有 的 关键 路 径 上 的 关键 活动 才能 达到 这 个 目的 。 例 如 图 6. 25 中 ,ai 是 关键 活动 , 它 在 关 
键 路 径 (ui ,us ,vs ,vs ,vs) 上 ,而 不 在 另 一 条 关键 路 径 (v1 ,vs,vs ,vi,vs) 上 。 如 果 加 快 它 的 
进度 ,使 它 由 4 天 变 成 3 天 ,并 不 能 把 整个 工程 所 需 的 时 间 缩 短 为 17 天 。 只 有 对 那些 处 在 
所 有 关键 路 径 上 的 活动 ,加 快 其 进度 ,才能 缩短 整个 工程 的 完成 时 间 。 例 如 将 活动 cy 由 6 
天 缩短 为 5 天 , 则 整个 工程 的 完成 时 间 将 由 18 天 缩短 为 17 天 。 


6.6 最 短路 径 及 应 用 


交通 网 络 可 以 画 成 带 权 的 图 ,图 中 顶点 代表 城市 , 边 代表 城市 之 间 的 公路 , 边 上 的 权 表 
示 两 个 城市 之 间 的 距离 或 者 表示 走 过 一 段 公 路 所 耗费 的 时 间 等 。 对 于 汽车 司机 来 说 ,一 般 
关心 的 两 个 问题 是 : 

(1) 两 地 之 间 是 否 有 公路 可 通 ? 

(2) 在 有 几 条 公路 可 通 的 情况 下 , 哪 一 条 公路 最 短 ? 

这 里 提出 的 问题 就 是 带 权 图 中 最 短路 径 的 问题 ,此 时 路 径 的 长 度 不 是 路 径 上 边 的 数目 ， 
而 是 路 径 上 各 边 的 权 之 和 。 

本 节 考 虑 有 向 图 ,路 径 的 开始 顶点 称 为 源 点 ,路 径 的 最 后 顶点 称 为 终点 ,并 且 假定 所 有 
的 权 都 是 正 的 ,给 出 求 最 短路 径 的 两 个 算法 : 

(1) 求 从 某 个 源 点 到 其 他 各 项 点 的 最 短路 径 ( 称 为 单 源 最 短路 径 ); 

(2) 求 每 个 顶点 之 间 的 最 短路 径 。 


6.6.1 单 源 最 短路 径 


设 G=(V,E) 是 一 带 权 的 有 向 图 , 源 点 为 v, 找 出 从 v。 到 其 他 项 点 的 最 短路 径 。 

如 图 6. 29 所 示 带 权 的 有 向 图 ,从 源 点 v。 到 其 他 顶点 的 最 短路 径 如 图 6. 30 所 示 。 从 图 
中 可 见 , 从 we 到 wv; 有 两 条 不 同 的 路 径 : (vo ,vs,vs) 和 (vo ,vs ,vs), 前 者 长 度 为 60, 后 者 长 
度 为 50, 因 此 50 是 we 到 vs 的 最 短路 径 长 度 ; 而 从 we 到 vi 没有 路 径 。 


源 点 终点 最 短路 径 路 径 长 度 


vo vl 无 
Uy (vo U,) 10 
U3 (Vo Va U3) 50 
Ua (vo Va) 30 


vs (Uo, Va V3 Vs) 60 


图 6.29 带 权 有 向 图 D， 图 6.30 有 向 图 D, 中 从 wv。 到 其 余 各 点 的 最 短路 径 


迪 杰 斯 特 拉 (Dijkstra) 提 出 了 一 个 按 路 径 长 度 递增 的 次 序 产 生 最 短路 径 的 算法 。 

设 集合 S 存放 已 经 求 得 最 短路 径 的 终点 。 初 始 状态 时 ,S 中 只 有 一 个 顶点 , 即 选 定 的 
源 点 v。 ,以 后 每 求 得 一 条 最 短路 径 (vo ,vi，… ,vi ) 便 将 终点 v 加 入 到 集合 S 中 。 用 一 维 数 
组 dist 的 元 素 dist[j] 存 放 从 源 点 we 起 ,中 间 只 经 过 集合 S 中 顶点 ,到 达 S 以 外 的 任 一 个 
顶点 v;(v; EV 一 S) 的 路 径 中 有 最 短 长 度 的 路 径 长 度 值 。 如 果 从 v。 起 ,中 间 只 经 过 S 中 的 
顶点 到 wv 没有 路 径 , 则 dist[j ] 的 值 为 2, 由 于 dist[j 的 值 为 从 源 点 v。 到 w 的 暂时 最 短路 


就 是 从 v。 到 v; 的 最 短路 径 的 长 度 。 
初始 状态 下 ,S 三 {vo}), 则 


《vosv;) 的 权 值 《v6,v;)EE 
dist[;] = 
co (vorv) FE 


这 时 dist[j 的 值 为 从 we 起 ,中 间 只 经 过 S 中 的 顶点 (S 二 {vo)) 到 达 w; 的 暂时 的 最 短 
路 径 长 度 。 
一 般 地 , 若 已 经 求 得 & 条 最 短路 径 , 这 时 S 中 必 有 kk 十 1 个 顶点 , 且 dist[7] 是 从 we 到 
vj; ,中间 只 经 过 这 上 十 1 个 顶点 的 暂时 最 短路 径 长 度 。 那 么 若 求 得 第 & 十 1 条 最 短路 径 为 
(ooyu yu S 中 将 增加 一 个 新 顶点 w 。 为 了 使 distL7] 的 值 满足 上 述 定义 ,应 做 如 下 
修正 : 
dist[j ] = min{dist[j j ,dist[t 二 w(t ,7)} 
其 中 ,w(t,j) 是 边 (v,,v;) 上 的 权 值 ,v; EV 一 S 一 {v,},v, 是 所 求 得 的 第 上 十 1 条 最 短路 径 
的 终点 。 
如 何 求 最 短路 径 呢 ? 
第 一 条 最 短路 径 是 (wo ,vi ) ,其 中 wx 满足 : 
dist[k |]=min{dist[i] | v; EV 一 {uo})} 
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一 般 地 ,如 果 S 为 已 求 得 的 最 短路 径 终 点 的 集合 , 则 可 以 证 明 下 一 条 最 短路 径 必然 是 
从 vo 出 发 ,中 间 只 经 过 S 中 的 顶点 便 可 达到 的 那些 顶点 v, EV 一 S 的 路 径 中 的 一 条 。 如 果 
从 us 到 的 路 径 上 存在 一 个 顶点 v, EV 一 S, 则 路 径 (v。,…,v,,…,v,) 不 可 能 是 下 一 条 最 
短路 径 , 显 然 路 径 (v。,…,v,) 比 它 短 (因为 边 上 的 权 值 总 为 正 )。 由 于 Dijkstra 算法 是 按照 
最 短路 径 的 长 度 的 递增 次 序 来 逐次 产生 各 条 最 短路 径 的 ,所 以 ,如 果 dist[j 是 按照 前 面 描 
述 的 方式 形成 和 修正 的 ,那么 下 一 条 最 短路 径 必然 是 : 
dist[k]=min{dist[i] | v; EV 一 S} 
车 用 邻接 链表 来 存储 图 , 则 有 : 
wi,j) (viv;)) EE 
ee z 一 了 
co 其 他 
Dijkstra 算法 可 以 简单 地 描述 如 下 : 
(1) S<— {v1}; dist[j J]<cost[1,)],) =2,. ,7n; 
(2) 选择 w 使 得 : 
dist[j ] =min{dist[i] | wu EV 一 S} 
v; 就 是 当前 求 得 的 一 条 从 w 出 发 的 最 短路 径 的 终点 。 令 
S=SU {)} 
(3) 修改 从 w 出 发 到 集合 V 一 S 上 任 一 个 顶点 v 可 达 的 最 短路 径 长 度 , 如 果 
dist[j ] + cost[j ,k] < dist[A] 
则 修改 dist[k] 为 
dist[k] = dist[j j 二 cost[j ,kj 
(4) 重复 (2)、(3) 共 一 1 次 ,由 此 求 得 从 wv 到 图 上 其 余 各 顶点 的 最 短路 径 是 依 路 径 长 
度 递增 的 序列 。 
例如 ,图 6. 29 所 示 的 有 向 网 D, 的 带 权 邻 接 矩 阵 为 : 
co co 10 co 30 100 


co oo co co co 


若 对 D, 图 实施 Dijkstra 算法 , 则 从 v。 到 其 余 各 顶点 的 最 短路 径 以 及 运算 过 程 中 dist 
数组 的 变化 情况 如 表 6. 3 所 示 。 


表 6.3 6.29 所 示 图 实施 Dijkstra 算法 从 v。 到 其 余 各 顶点 的 最 短路 径 
以 及 运算 过 程 中 dist 数组 的 变化 情况 


终 ”点 从 到 各 终点 的 dist 值 和 最 短路 径 


vl co co co co 


(ooyoz) 


续 表 
终 点 从 ws 到 各 终点 的 dist 值 和 最 短路 径 
60 50 
天 Be 
vv Cp sway 

30 30 

六 
(vo v4) (vo sv4) 

100 100 90 60 
办 (vorvs) oesvey Co | 
vj vs Uv vs Vs 


用 CC 语言 描述 的 Dijkstra 算法 如 下 。 
算法 6.11 求 单 源 最 短路 径 Dijkstra 算法 。 


# include < stdio.h> 


# define nmax 100 // 顶 点 最 大 个 数 
# define Max 10000 // 权 值 最 大 值 
//cost 为 带 权 有 向 图 的 邻接 矩阵 ,v 为 指定 的 源 点 

void shortpath( int cost[ ][nmax], int n, int v) //v 为 指定 的 源 点 
{ 


int dist[nmax], s[nmax], parent[nmax]; 
//dist[i] 为 当前 源 点 到 顶点 i 的 最 小 距离 ,s 表示 相应 顶点 是 否 并 入 集合 的 标志 , parent[i] 表 
// 示 i 在 单 源 最 短路 径 中 的 前 驱 


int 1, j,k,win, f£; 


for (i=0;i<n;it+) // 初 始 化 s 和 parent 
{ 
s[i]=0; 
parent[i] = - Max; // 标 志 
} 
for (i=0;i<n;it+) // 初 始 化 dist 和 处 理 parent 
{ 


dist[i] = cost[v][i]; 
if (dist[i]< Max) 


parent[i] =v; 
} 
s[v]=1; //v 并 入 集合 
for (k=0;k<n;k++) // 并 入 N 个 顶点 , 即 求 N 条 最 短路 径 
{ 


win= Max;j=v; 
for (i=0;i<n;it+) // 选 最 小 的 dist[j] 
if (s[i] == 0&&sdist[i]< win) 
{j= iwin= dist[i];} 
if (j!=v) 
{ 
s[j]=1; 
printf("the shortest distance of %d is %d\n",j,dist[j]); 
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printf("the path of %d is :\n",j); 
for (f=j;f>=0;f= parent[f]) 


printf(" % 5d", £); // 道 序 打印 最 短路 径 
printf("\n"); 
for (i=0;i<=n;it+) // 修 改 从 源 点 到 其 余 各 点 的 最 短 距离 


if (s[i] == 0g&( (dist[j] + cost[j][i])< dist[i])) 
// 现 在 从 源 点 经 过 j 到 i 比 原来 要 短 则 修改 


{ 
dist[i] = dist[j] + cost[j][i]; 
parent[i] = j; 
HH/if 
HH/if 
}//for 


}//end 


上 述 算法 的 执行 时 间 ,外 循环 每 执行 一 次 ,内 循环 执行 n 次 ,所 以 共 需 时 间 O(n?), 因 
而 整个 算法 的 时 间 复 杂 度 为 O(n?)。 


6.6.2 每 对 顶点 之 间 的 最 短路 径 


解决 这 个 问题 的 一 个 简单 的 方法 是 ,依次 把 有 向 图 G 中 的 个 顶点 的 每 一 个 顶点 作为 
源 点 ,重复 执行 Dijkstra 算法 n 次 ,就 可 求 得 每 一 对 顶点 之 间 的 最 短路 径 , 该 方法 的 时 间 复 
杂 度 为 O(n ) 。 

下 面 介绍 解决 该 问题 的 另 一 个 算法 , 弗 洛 伊 德 (Floyd) 算 法 。 其 执行 时 间 仍 为 O(n )， 
但 形式 上 要 简单 些 。 

Floyd 法 仍 用 邻接 矩阵 cost 存储 有 向 图 。 其 基本 思想 是 ; 假设 求 从 顶点 w 到 的 最 
短路 径 。 如 果 从 v; 到 w 有 弧 , 则 从 w 到 vw 存在 一 条 长 度 为 cost[i,j] 的 路 径 , 用 二 维 数 组 
A 的 元 素 a 记 ,7 门 存放 从 w 到 vw; 中 间 只 经 过 集合 S 中 的 顶点 的 所 有 可 能 的 路 径 中 ,具有 最 
短 长 度 的 路 径 的 长 度 。 初 始 化 时 S=={) ,于 是 weLi, 门 =costLi 7, 接着 进行 次 试探 ,依次 
向 集合 S 中 加 入 vi ,vs，…,v, ,每 次 加 入 一 个 顶点 。 首 先 S=SU{ui) ,考虑 路 径 (uwi ,vi， 
vj ) 是 否 存 在 , 即 判 别 弧 (vw; ,vi) 和 (vi ,vj ) 是 否 存在 ,如 果 存 在 , 则 比较 (wuw ,vj) 和 (vw; ,vi， 
vj ) 的 路 径 长 度 , 取 长 度 最 短 者 为 从 w 到 w; 的 中 间 只 经 过 S 中 的 顶点 的 最 短路 径 。 然 后 再 
向 S 中 加 入 vw,S 二 SU {vs), 在 路 径 上 再 增加 一 个 顶点 wv, 也 就 是 说 ,如 果 (v;,… ,vs) 和 
(vs，…,v;) 分 别 是 当前 找到 的 中 间 顶 点 仅 为 w 的 最 短路 径 , 那 么 (v;，,… ,vs,…,v; ) 就 有 可 
能 是 w 到 vw; 的 中 间 顶 点 仅 为 v1 、vs 的 最 短路 径 ,将 它 和 已 经 得 到 的 从 w 到 wv 的 中 间 顶 点 
只 为 w 的 最 短路 径 相 比较 , 选 出 最 小 者 ,作为 从 v; 到 vw; 中 间 顶 点 仅 为 vi .vs 的 最 短路 径 ， 
再 向 S 中 加 入 顶点 vs 继续 进行 试探 ,以 此 类 推 。 

一 般 地 ,向 S 中 加 入 内 :车 (um vi) 和 (vi ，… ,wv;) 分 别 是 从 wv; 到 v 和 从 wi 到 wv; 的 
中 间 顶 点 为 vi ,vs，… ,vi-1 的 最 短路 径 , 则 将 (v;,… ,vi，…，v;) 和 已 经 得 到 的 从 wv; 到 vw; 
且 中 间 顶 点 为 v1 ,v，。… ,v1 的 最 短路 径 相 比较 ,最 小 者 就 是 从 v; 到 wv 中 间 顶 点 为 w ， 
vo，"… ,vs 的 最 短路 径 。 这 样 ,在 经 过 n 次 比较 后 ,最 后 求 得 的 必 是 从 w 到 vw 的 最 短路 径 。 
当 i,j 遍历 从 1 到 nn 时 ,可 以 求 得 图 中 各 对 顶点 间 的 最 短 距离 。 


算法 6. 12 求 每 对 顶点 之 间 的 最 短路 径 Floyd 算法 。 


void shortpath FLOYD(int cost[N][N],int a[N][N], int path[N][N]) 
{ 
int i, j, k; 
for (i = 1; i<=N; i++) 
for (j = 1; j<=N; j++) 
{ 
a[lil[j] = data[i][j]; 
path[i][j]= -1; 
} 
for (k = 0; k < length; k++) 
for (i = 0; i< length; i++) 
for (j = 0; j < length; j++) 
| 
if (i == j) // 对 角 线 上 的 元 素 ( 即 顶点 自身 之 间 ) 不 子 考虑 
continue; 
if (a[i][k] +a[k][j]<a[i][j]) // 从 i 经 k 到 j 的 一 条 路 径 更 短 
{ 
D[i][j] = D[i][k] + DIk][j]; 
path[i][j]=k; 


} 
把 算法 6. 12 用 于 图 6. 31 的 带 权 有 向 图 ,所 得 结果 (包括 中 间 结 果 ) 如 图 6. 32 所 示 。 


0 411 
6 0 2 
3- :3 0 
C 
(a) 有 向 图 (b) 邻接 矩阵 
图 6.31 带 权 有 向 图 
a(0) a(1) a(2) a(3) 
1 2 3 1 2 3 1 2 3 1 2 3 
1 0 4 11 0 4 11 0 4 6 0 4 6 
2 6 0 2 6 0 2 6 0 2 5 0 2 
3 3 8 3 7 0 3 ? 0 3 0 
path(0) path(1) path(2) path(3) 
path 
1 过 入 1 过 3 1 2 入 1 2 3 
1 AB | AC AB | AC AB | ABC AB | ABC 
2 BA BC | BA BC | BA BC | BCA BC 
3 CA CA |CAB CA |CAB CA |CAB 


图 6.32 6. 31 中 有 向 图 的 最 短路 径 及 其 路 径 长 度 
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6.7 C++ 中 的 图 


6.7.1 C++ 中 的 图 类 


借助 C++ 的 模板 抽象 类 来 定义 图 的 抽象 数据 类 Graph, 如 例 6.1 所 示 。 例 6.2 是 图 的 
邻接 矩阵 类 MGraph ,该 类 继承 了 类 Graph。 例 6. 3 是 类 MGraph 的 构造 函数 和 析 构 函数 。 
例 6.1 Graph 类 。 


template< class T> 

class Graph 

{ 

public: 
virtual ResultCode Insert(int u int v, T& w) = 0; 
virtual ResultCode Remove( int u, int v) = 0; 
Virtual bool Exist(int u int v)const = 0; 


Virtual int Vertices( )const {return n;} 


protected: 
int n,e; 


}; 
例 6.2 MGraph 类 。 


template < class T> 

class MGraph:public Graph<T> 

{ 

public: 
MGraph( int mSize, const T& noedg); 
~MGraph( ); 
ResultCode Insert(int u, int v, T& w); 
ResultCode Remove( int u int v); 
bool Exist(int u int v)const; 


protected: 
Txx%a; 
T noEdge; 
}; 


例 6.3 MGraph 类 的 构造 函数 和 析 构 函数 。 


template < class T> 
MGraph < T >: :MGraph( int mSize, const T& noedg) 
{ 
n= mSize;e= 0;noEdge = noedg; 
a= new Tx*[n]; 
for(int i=0;i<n;it+){ 
a[i] =new T [n]; 
for (int j=0;j<n;j++) a[i][j] = nogdge; 


a[i][i=0; 
} 
} 
template < class T> 
MGraph < T>: :一 MGraph() 
{ 


for(int i=0;i<n;it+) delete []a[i]; 
delete [ Ja; 


6.7.2 图 的 邻接 表 的 C++ 程序 


例 6.4 和 例 6. 5 分 别 为 图 的 邻接 表 表 示 的 边 结 点 和 邻接 表 的 C++ 类 。 边 结 点 由 类 
ENode 定义 ,类 LGraph 是 从 抽象 类 Graph 派生 得 来 , 它 继承 了 Graph 的 数据 成 员 n 和 。e， 
重 载 了 Graph 的 纯 虚 函数 。 例 6.6 是 类 LGraph 的 构造 函数 和 析 构 函数 。 例 6.7 是 图 的 邻 
接 表 类 LGraph 的 部 分 基本 运算 。 

例 6.4 ENode 类 。 


template< class T > 
struct ENode 
| 
ENode( ) { nextArc = NULL; } 
ENode( int vertex, T weight, ENode* next) 
{ 
adjVex = vertex; w= weight; nextArc = next; 
} 
int adjVex; 
Tw; 
ENode * nextArc; 


}; 
例 6.5 LGraph 类 。 


template < class T> 
class LGraph: public Graph<T> 


{ 
public: 
LGraph( int mSize); 
一 LGraph( ); 
ResultCode Insert(int u int v, T& w); 
ResultCode Remove( int u, int v); 
bool Exist(int u int v)const; 
protected: 


ENode < T>** a; 
}; 


例 6.6 LGraph 类 的 构造 函数 和 析 构 函数 。 


template < class T> 
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L6Graph< T >: :L6Graph( int mSize) 

{ 

n= mSize;e= 0; 

a=new ENode <T>* [n]; 

for (int i=0;i<n;it+) a[i] = NULL; 

} 

template < class T> 

LG6raph< T >::~LGraph() 

{ 

ENode<T>* p, *q; 

for(int i=0;i<n;it++){ 
p=alil;q=p; 
while (p) { 

p=p->nextArc;delete q;q= p; 


| 
delete[ ] a; 


} 
例 6.7 类 LGraph 的 查找 .插入 和 删除 。 


template < class T> 
bool LGraph < T >: :Exist(int u, int v)const 
if(u<0llv<ollu>n-1lllv>n-1lllu==v) return false; 
ENode<T>* p=a[u]; 
while (pP&& p—>adjVex!=v) p=p-> nextArc; 
if (!p) return false; 
else return true; 
} 
template < class T> 
ResultCode LGraph < T >::Insert(int u int v, T& w) 
{ 
if(u<0|ll|v<0llu>n-1lllv>n-1lllu==v) return Failure; 
if(Exist(u,v))return Duplicate; 
ENode <T>* p=new ENode <T>(v,w,a[u]); 
a[u] = p;ett; 
return Success; 
} 
template < class T> 
ResultCode LGraph < T >: :Removel( int u int v) 
{ 
if(u<0|l|lv<ollu>n-1|l|lv>n-1||u==v) return Failure; 
ENode<T>* p=a[lu], * q= NULL; 
while (pg&& p—>adjVex!= v){ 
q=p;p=p-> nextArc; 
1 
if (!p) return NotPresent; 
if (q) q—> nextArc = 了 一 > nextArc; 
else a[u] =p-> nextArc; 
delete p;e— 


部 
CD 
山 
加 


return Success; 


6.7.3 图 的 遍历 的 C++ 程序 


例 6. 8 是 图 的 遍历 类 ExtLGraph, 该 类 继承 了 类 Graph。 例 6. 9 是 图 的 深度 优先 遍历 
算法 。 
例 6.8 ExtLGraph 类 。 


template < class 了 > 
class ExtLGraph: public LGraph<T> 
{ 
public: 
ExtLGraph( int mSize) :LGraph <T >(mSize){} // 调 用 父 类 的 构造 函数 
void DFS( ); 
void BFS( ); 


private: 
void DFS(int v, bool * visited); 
void BFS(int v,bool * visited); 


}; 
例 6.9 图 的 深度 优先 遍历 算法 。 


template < class T> 
void ExtLGraph < T >: :DFS() 
{ 
bool * visited= new bool [n]; 
for(int i=0;i<n;it+) visited[i] = false; 
for (i=0;i<n;it+) 

if (!visited[i]) DFS(i, visited); 
delete[ J]visited; 
} 
template < class T> 
void ExtLGraph < T >: :DFS(int v,bool * visited) 
{ 

visited[v] = true;cout <<" "<<v; 
for (ENode <T> *w=a[v]; w; w=w—>nextArc) 

if (!visited[w— > adjVex]) DFS(w— > adjVex, visited); 


6.7.4 图 的 最 小 生成 树 的 C++ 程序 


图 的 最 小 生成 树 的 典型 算法 有 Prim 算法 和 Kruskal 算法 , 例 6. 10 是 C++ 实现 的 Prim 
算法 。 
例 6.10 Prim 算法 C++ 程序 。 


template< class T> 
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void ExtLGraph < T >::Prim(int k, int * nearest,T* lowcost) 
| 
bool * mark = new bool[n]; 
ENode <T> *p; 
证 (k<0||k>n-1) throw OutofBounds; 
for (int i=0;i<n;it+){ // 初 始 化 
nearest[i] = — 1;mark[i] = false; 
lowcost[i] = INFTY; 
} 
lowcost[k] = 0; nearest[k] =k; mark[k] = true;  // 源 点 k 加 入 生成 树 
for (i=1;i<n;it+){ 
for(p=a[k];p;p=p—-> nextArc){ // 修 改 lowcost 和 nearest 的 值 
int j= p— >adjVex; 
if ((!mark[j])&&(lowcost[j]>p—>w)){ 
lowcost[j] =p—->w; nearest[j] =k; 
} 
站 
T min = INFTY; // 求 下 一 条 最 小 权 值 的 边 
for (int j=0;j<n;jt+) // 求 不 属于 树 中 的 顶点 中 ,具有 最 小 lowcost 的 顶点 k 
if ((!mark[j])&&(lowcost[j]<min)){ 
min = lowcost[j]; k=j; 
} 
mark[k] = true; // 将 顶点 k 加 到 生成 树 上 
} 
} 


侣 题 6 


1. 在 图 6. 33 所 示 的 有 向 图 中 , 试 给 出 : 

(1) 每 一 个 顶点 的 人 度 和 出 度 ; 

(2) 邻接 矩阵 ; 

(3) 邻接 表 ; 

(4) 强 连 通 分 量 。 

2. 在 图 6. 34 所 示 的 有 向 图 中 : 

(1) 该 图 是 强 连通 的 吗 ? 若 不 是 , 则 给 出 其 强 连通 分 量 。 
(2) 给 出 图 的 邻接 矩阵 、 邻 接 表 、 逆 邻接 表 。 

(3) 给 出 每 个 顶点 的 度 、 入 度 和 出 度 。 


图 6.33 有 向 图 示例 图 1 图 6.34 有 向 图 示例 图 2 


3. 7 个 项 点 的 强 连 通 图 至 少 有 多 少 条 边 ,这 样 的 有 向 图 是 什么 形状 ? 

4. 对 于 图 6. 35 所 示 的 带 权 的 有 向 图 , 试 给 出 : 

(1) 邻接 矩阵 : 

(2) 写 出 邻接 表 。 

5. 分 别 写 出 用 深度 优先 搜索 法 和 广度 优先 搜索 法 遍历 具有 6 个 顶点 的 完全 图 的 序列 。 
假设 都 以 w 为 出 发 点 。 

6. 对 图 6. 36 所 示 的 有 向 图 ,从 顶点 v 出 发 ,分 别 画 出 其 深度 优先 生成 树 和 广度 优先 
生成 树 。 


图 6.35 有 向 图 示例 图 3 图 6.36 有 向 图 示例 图 4 


7. 实现 在 邻接 表 上 删除 一 条 边 和 删除 一 个 结 点 的 算法 。 

8. 实现 计算 有 向 图 中 各 顶点 的 入 度 的 算法 。 设 以 有 向 图 用 邻接 表 作 为 存储 结构 。 

9. 实现 将 一 个 已 知 图 的 邻接 矩阵 存储 形式 转换 成 邻接 表 的 存储 形式 的 算法 。 

10. 实现 在 邻接 矩阵 存储 结构 上 实现 深度 优先 遍历 和 广度 优先 遍历 的 算法 。 

11. 实现 在 邻接 表 上 进行 深度 优先 遍历 和 广度 优先 遍历 的 非 递 归 算 法 。 

12. 自选 存储 结构 ,实现 判别 无 向 图 中 任意 给 定 的 两 个 顶点 之 间 是 否 存 在 一 条 长 度 为 
KK 的 简单 路 径 的 算法 。 

13. 有 边 集 (1,2),(2,3),《5,2),《5,6),《6,4),《3,4), 求 此 图 的 所 有 可 能 的 拓扑 序列 。 
若 以 此 顺序 建立 图 的 邻接 表 , 再 在 此 存储 结构 上 执行 拓扑 排序 过 程 , 则 得 到 的 拓扑 序列 是 哪 
一 种 ? 

14. 对 于 图 6. 37 所 示 的 AOE 网 , 求 出 各 活动 可 能 的 最 早 开始 时 间 和 允许 的 最 晚 完成 
时 间 。 并 回答 : 整个 工程 的 最 短 完 成 时 间 是 多 少 ? 哪些 活动 是 关键 活动 ? 是 否 有 哪 项 活动 
提高 速度 后 能 导致 整个 工程 提前 完成 ? 

15. 对 图 6. 35 所 示 的 有 向 网 , 试 利用 Dijkstra 算法 求 从 源 点 w 到 其 他 各 顶点 的 最 短 
路 径 。 
16. 对 图 6. 38 所 示 的 连通 图 ,请 分 别 用 Prim 和 Kruskal 算法 构造 其 最 小 生成 树 。 

7. 设计 算法 , 求 有 向 图 的 深度 和 广度 优先 遍历 的 生成 森林 。 

18. 设计 算法 , 求 有 向 图 的 强 连 通 分 量 。 

19. 用 Dijkstra 和 Floyd 算法 求 图 6. 35 所 示 有 向 图 , 源 点 为 wi 的 最 短路 径 。 写 出 执行 
算法 过 程 中 各 步 的 状态 。 


je 
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1. 设计 一 个 算法 ,判断 无 向 图 G 是 否 连 通 。 若 连通 则 返回 1; 否则 返回 0。 

2. 建立 一 个 邻接 表 存 储 结构 的 图 G ,分 别 设计 实现 以 下 功能 的 算法 : 求 出 图 中 每 个 顶 
点 的 出 度 ; 计算 图 中 出 度 为 0 的 顶点 数 。 

3. 设计 一 个 算法 创建 一 个 带 权 (路 径 ) 的 无 向 图 ,输出 从 we 到 其 他 各 个 顶点 的 最 短路 
径 长 度 和 路 径 。 

提示 : 采用 Dijkstra 算法 求 一 个 顶点 到 其 他 所 有 顶点 的 最 短路 径 。 

4. 最 小 生成 树 问题 。 

基本 要 求 利用 Kruskal 算法 求 网 的 最 小 生成 树 ,输出 构造 生成 树 过 程 中 的 连通 分 量 ， 
以 文本 形式 输出 生成 树 中 各 条 边 以 及 其 权 值 。 

5. 编写 一 个 算法 ,根据 用 户 输入 的 偶 对 (以 输入 0 表示 结束 ) 建 立 其 有 向 图 的 邻接 表 ， 
并 输出 其 一 个 拓扑 排序 序列 ,判断 是 否 存在 回路 。 


本 章 学 习 要 点 

(1) 熟练 掌握 顺序 表 和 有 序 表 的 查找 方法 。 

(2) 熟悉 静态 查找 树 的 构造 方法 和 查找 算法 ,理解 静态 查找 树 和 折 半 查找 的 关系 。 

(3) 熟练 掌握 二 又 排序 树 的 构造 和 查找 方法 。 

(4) 理解 二 又 平衡 树 的 维护 平衡 方法 。 

(5) 理解 B- 树 、.B 十 树 的 特点 以 及 它们 的 建树 过 程 。 

(6) 熟练 掌握 哈 希 表 的 构造 方法 ,深刻 理解 哈 希 表 与 其 他 结构 的 表 的 实质 性 的 差别 。 

(7) 掌握 描述 查找 过 程 的 判定 树 的 构造 方法 ,以 及 按 定义 计算 各 种 查找 方法 在 等 概率 
情况 下 查找 成 功 时 的 平均 查找 长 度 。 

在 英汉 字典 中 查找 某 个 英文 单词 ; 在 新 华 字典 中 查找 某 个 汉字 的 读音 、 含 义 ; 在 对 数 
表 、 平 方 根 表 中 查找 某 个 数 的 对 数 ,平方根 ; 邮递 员 送 信件 要 按 收 件 人 的 地 址 确定 位 置 等 ， 
可 以 说 查找 是 为 了 得 到 某 个 信息 而 常常 进行 的 工作 。 

计算 机 、 计 算 机 网 络 使 信息 查询 更 快捷 方便 、 准 确 。 要 从 计算 机 、 计 算 机 网 络 中 查找 特 
定 的 信息 ,就 需要 在 计算 机 中 存储 包含 该 特定 信息 的 表 , 如 要 从 计算 机 中 查找 英文 单词 的 中 
文 含义 ,就 需要 存储 类 似 英汉 字典 这 样 的 信息 表 , 以 及 对 该 表 进 行 查找 操作 。 本 章 将 讨论 的 
问题 即 是 “信息 的 存储 和 查找 ”。 

由 于 查找 操作 的 使 用 频率 很 高 ,几乎 在 任何 一 个 计算 机 系统 软件 和 应 用 软件 中 都 会 涉 
及 ,所 以 当 问 题 所 涉及 的 数据 量 相当 大 时 ,查找 方法 的 效率 就 显得 格外 重要 ,在 一 些 实时 查 
询 系 统 中 尤其 如 此 ,一 个 好 的 查找 方法 会 大 大 提高 运行 速度 。 


Ci 基本 概念 与 术语 


下 面 以 学 校 招生 录取 登记 表 ( 如 表 7. 1 所 示 ) 为 例 ,来 讨论 计算 机 中 表 的 概念 。 
1. 数据 项 


数据 项 (也 称 项 或 字段 ) 是 具有 独立 含义 的 标识 单位 ,是 数据 不 可 分 割 的 最 小 单位 。 如 
表 7. 1 中 “学 号 ”“ 姓 名” 年” 等。 项 有 项 名 和 项 值 之 分 .项 名 是 一 个 项 的 标识 ,用 变量 定义 ， 
而 项 值 是 它 的 一 个 可 能 取 值 , 表 7. 1 中 20110983 是 项 “学 号 ”的 一 个 取 值 。 项 具有 一 定 的 类 
型 , 依 项 的 取 值 类 型 而 定 。 


表 7.1 学 校 招生 录取 登记 表 


学 号 姓 名 性 别 来 源 总 分 | 录取 专业 
年 月 日 

20110983 何 将 男 1992 | 10 15 巴蜀 中 学 595 软件 工程 

20110984 钱 程 男 1992 | 07 22 育才 中 学 605 网 络 工 程 

20110985 李长江 女 | 1993 | 02 05 巴 县 中 学 598 软件 工程 


由 若干 项 构成 ,如 表 中 “出 生日 期 "就 是 组 合 项 , 它 由 “年 “月 “日 ”三 项 组 成 。 


3. 数据 元 素 ( 记 录 ) 


数据 元 素 (记录 ) 是 由 若干 项 组 合 项 构成 的 数据 单位 ,是 在 某 一 问题 中 作为 整体 进行 考 
虑 和 处 理 的 基本 数据 单位 。 数 据 元 素 有 类 型 和 值 之 分 。 表 中 项 名 的 集合 , 即 表 头 部 分 就 是 
数据 元 素 的 类 型 ; 而 一 个 学 生 对 应 的 一 行 数据 就 是 一 个 数据 元 素 的 值 。 表 中 全 体 学 生 即 为 
数据 元 素 的 集合 。 


4. 关键 字 


关键 字 是 数据 元 素 (记录) 中 某 个 项 或 组 合 项 的 值 , 用 它 可 以 标识 一 个 数据 元 素 (记录 )。 
能 唯一 确定 一 个 数据 元 素 (记录 ) 的 关键 字 , 称 为 主 关键 字 ; 不 能 唯一 确定 一 个 数据 元 素 ( 记 
录 ) 的 关键 字 , 称 为 次 关键 字 。 例 如 , 表 中 “学 号 ”可 看 成 主 关键 字 ;“ 姓 名 ” 则 应 视 为 次 关键 
字 , 因 为 可 能 有 同名 同姓 的 学 生 。 


5. 查找 表 


查找 表 是 由 具有 同一 类 型 (属性 ) 的 数据 元 素 (记录 ) 组 成 的 集合 。 查 找 表 分 为 静态 查找 
表 和 动态 查找 表 两 类 。 

(1) 静态 查找 表 : 仅 对 查找 表 进 行 查找 操作 ,而 不 能 改变 的 表 。 

(2) 动态 查找 表 : 除了 进行 查找 操作 外 ,可 能 还 要 向 表 中 插入 数据 元 素 或 删除 表 中 数 
据 元 素 的 表 。 


6. 查找 


查找 是 按 给 定 的 某 个 值 kx, 在 查找 表 中 查找 关键 字 为 给 定 值 kx 的 数据 元 素 ( 记 录 ) 的 
操作 。 

当 关键 字 是 主 关键 字 时 .由 于 主 关 键 字 唯一 ,所 以 查找 结果 也 是 唯一 的 。 一 旦 找到 , 则 
查找 成 功 ,结束 查找 过 程 ,并 给 出 找到 的 数据 元 素 ( 记 录 ) 的 信息 ,或 指示 该 数据 元 素 ( 记 录 ) 
的 位 置 。 要 是 整个 表 检测 完 , 还 没有 找到 , 则 查找 失败 ,此 时 ,查找 结果 应 给 出 一 个 “ 空 ” 记 录 
或 “ 空 "指针 。 
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当 关键 字 是 次 关键 字 时 ,需要 查 遍 表 中 所 有 数据 元 素 ( 记 录 ) ,或 在 可 以 肯定 查找 失败 
时 ,才能 结束 查找 过 程 。 


7. 数据 元 素 类 型 说 明 


在 手工 绘制 表格 时 ,总 是 根据 有 多 少数 据 项 、 每 个 数据 项 应 留 多 大 宽度 来 确定 表 的 结 
构 , 即 表 头 的 定义 。 然 后 ,再 根据 需要 的 行 数 , 画 出 表 来 。 在 计算 机 中 存储 的 表 与 手工 绘制 
的 类 似 ,需要 定义 表 的 结构 ,并 根据 表 的 大 小 为 表 分 配 存储 单元 。 下 面 以 表 7. 1 为 例 , 用 C 
语言 的 结构 类 型 描述 。 


// 出 生日 期 类 型 定义 
typedef struct 
{ char year[5]; // 年 :用 字符 型 表示 , 宽度 为 4 个 字符 
char month[ 3]; // 月 :字符 型 ,宽度 为 2 
char date[3]; // 日 :字符 型 ,宽度 为 2 
}BirthDate; 
// 数 据 元 素 类 型 定义 
typedef struct 
{ char number[7]; // 学 号 :字符 型 ,宽度 为 6 
char name[9]; // 姓 名 :字符 型 ,宽度 为 8 
char sex[3]; // 性 别 :字符 型 ,宽度 为 2 
BirthDate birthdate; // 出 生日 期 :构造 类 型 ,由 该 类 型 的 宽度 确定 
char comefrom[ 21]; // 来 源 : 字 符 型 ,宽度 为 20 
int results; // 总 分 : 整 型 ,宽度 由 程序 设计 C 语 言 工具 软件 决定 
} ElemType; 


以 上 定义 的 数据 元 素 类 型 ,相当 于 手工 绘制 的 表 头 。 要 存储 学 生 的 信息 ,还 需要 分 配 一 
定 的 存储 单元 , 即 给 出 表 长 度 。 可 以 用 数组 分 配 , 即 顺序 存储 结构 ; 也 可 以 用 链 式 存储 结构 
实现 动态 分 配 。 


// 顺 序 分 配 1000 个 存储 单元 用 来 存放 最 多 1000 个 学 生 的 信息 
ElemType elem[1000]; 


本 章 以 后 的 讨论 中 ,涉及 的 关键 字 类 型 和 数据 元 素 类 型 统一 说 明 如 下 : 


typedef struct 

{ 
KeyType key; // 关 键 字 字段 ,可 以 是 整 型 .字符 型 .构造 类 型 等 
oe // 其 他 字段 

} ElemType; 


C2 静态 查找 表 


7.2.1 静态 查找 表 结构 


静态 查找 表 是 数据 元 素 的 线性 表 , 可 以 是 基于 数组 的 顺序 存储 或 以 线性 链表 存储 。 
// 顺 序 存储 结构 


算法 与 数据 结构 (第 三 版 ) 


typedef struct 
{ 


ElemType * elem; // 数 组 基 址 
int length; // 表 长 度 
}S_TBL; 
// 链 式 存储 结构 结 点 类 型 
typedef struct NODE 
{ 
ElemType elem; // 结 点 的 值 域 
struct NODE * next; // 下 一 个 结 点 指针 域 
}NodeType; 
7.2.2 顺序 查找 


顺序 查找 又 称 线性 查找 ,是 最 基本 的 查找 方法 之 一 。 其 查找 方法 为 : 从 表 的 一 端 开始 ， 
向 另 一 端 按 给 定 值 kx 逐个 与 关键 字 进 行 比 较 。 若 找到 , 则 查找 成 功 , 并 给 出 数据 元 素 在 表 
中 的 位 置 ; 若 整 个 表 检 测 完 , 仍 未 找到 与 kx 相同 的 关键 字 , 则 查找 失败 ,给 出 失败 信息 。 
算法 7.1 以 顺序 存储 为 例 ,数据 元 素 从 下 标 为 1 的 数组 单元 开始 存放 ,0 号 单元 留 空 。 
// 在 表 tbl 中 查找 关键 字 为 kx 的 数据 元 素 , 若 找到 返回 该 元 素 在 数组 中 的 下 标 , 否则 返回 0 
int s_search(S_TBL tbl, KeyType kx) 
{ 
int i; 
tbl. elenm[0].key = kx; // 存 放 监 测 , 这 样 在 从 后 向 前 查找 失败 时 ,不 必 判 断 表 是 否 检测 完 
for(i = tb1. length;tbl. elem[ i].key!= lecii-- ); // 从 表 尾 端 向 前 找 
return i; 
} 
性 能 分 析 : 
分 析 查 找 算法 的 效率 ,通常 用 平均 查找 长 度 (ASL) 来 衡量 。 
在 查找 成 功 时 ,ASL 是 指 为 确定 数据 元 素 在 表 中 的 位 置 所 进行 的 关键 字 比 较 次 数 的 期 
望 值 。 
对 一 个 含 ”个 数据 元 素 的 表 ,查找 成 功 时 


ASL= >)P, . C， 


其 中 : P; 为 表 中 第 i 个 数据 元 素 的 查找 概率 , 且 > )P, 一 1。 

C; 为 表 中 第 i 个 数据 元 素 的 关键 字 与 给 定 值 相等 时 , 按 算法 定位 时 关键 字 的 比较 次 
数 。 显 然 ,不 同 的 查找 方法 ,C; 可 以 不 同 。 

就 上 述 算法 而 言 ,对 于 n 个 数据 元 素 的 表 , 给 定 值 与 表 中 第 i 个 元 素 关键 字 相等 , 即 定 
位 第 i 个 记录 时 , 需 进 行 n 一 i 十 1 次 关键 字 比 较 , 即 C;==n 一 i 十 1。 则 查找 成 功 时 ,顺序 查 
找 的 平均 查找 长 度 为 


ASL 一 >)P, .一 ;十 1) 
i=1 


设 每 个 数据 元 素 的 查找 概率 相等 . 即 P, 一 二 . 则 等 概率 情况 下 有 


ASL Di i 十 1) 
i=1 


查找 不 成 功 时 ,关键 字 的 比较 次 数 总 是 2 十 1 次 。 

算法 中 的 基本 工作 就 是 关键 字 的 比较 ,因此 ,查找 长 度 的 量 级 就 是 查找 算法 的 时 间 复 杂 
度 , 其 为 O(n)。 

许多 情况 下 ,查找 表 中 数据 元 素 的 查找 概率 是 不 相等 的 。 为 了 提高 查找 效率 ,查找 表 需 
依据 查找 概率 越 高 比较 次 数 越 少 、 查 找 概率 越 低 比较 次 数 越 多 的 原则 来 存储 数据 元 素 。 

顺序 查找 的 缺点 是 当 很 大 时 ,平均 查找 长 度 较 大 ,效率 低 ; 优点 是 对 表 中 数据 元 素 的 
存储 没有 要 求 。 

另外 ,对 于 线性 链表 ,只 能 进行 顺序 查找 。 


7.2.3 有 序 表 的 折 半 查找 


有 序 表 即 是 表 中 数据 元 素 按 关键 字 升 序 或 降序 排列 的 表 。 

折 半 查找 的 思想 为 : 在 有 序 表 中 , 取 中 间 元 素 作为 比较 对 象 , 若 给 定 值 与 中 间 元 素 的 关 
键 字 相 等 , 则 查找 成 功 ; 若 给 定 值 小 于 中 间 元 素 的 关键 字 , 则 在 中 间 元 素 的 左 半 区 继续 查 
找 ; 若 给 定 值 大 于 中 间 元 素 的 关键 字 , 则 在 中 间 元 素 的 右 半 区 继续 查找 。 不 断 重 复 上 述 查 
找 过 程 ,直到 查找 成 功 , 或 所 查找 的 区 域 无 数据 元 素 ,查找 失败 。 


和 下 | 
2 


其 步骤 如 下 : 

(1) low=1; high 一 length; // 设 置 初始 区 间 

(2) 当 low > high 时 ,返回 查找 失败 信息 // 表 空 ,查找 失败 
(3) 当 low<high 时 ,mid 王 (low 十 high)/2， // 取 中 点 

@ 若 kx<tbl.elem[Lmid]. key,; 则 high 二 mid 一 1; 转 (2) // 查 找 在 左 半 区 进行 
@ 若 kx> tbl.elem[midj. key, 则 low 王 mid 十 1; 转 (2) // 查 找 在 右 半 区 进行 


@ 若 kx=tbl.elem[Lmid]. key, 则 返回 数据 元 素 在 表 中 位 置 // 查 找 成 功 
算法 7.2 折 半 查找 算法 。 

// 在 表 tbl 中 查找 关键 字 为 kx 的 数据 元 素 , 若 找到 则 返回 该 元 素 在 表 中 的 位 置 ,否则 返回 0 
int Binary Search(S_TBL tbl, KeyType kx) 


{ 
int high, low, mid, flag = 0; 


low= 1; 
high= tbl. length; // 外 设置 初始 区 间 
while( low <= high) // 回 表 空 测试 
{ // 非 空 ,进行 比较 测试 
mid= (low+ high)/2; // 回 得 到 中 点 
if(kx < tbl.elem[mid].key) 
high= mid— 1; // 调 整 到 左 半 区 
else if(kx> tbl. elem[mid]. key) 
low= mid+1; // 调 整 到 右 半 区 
else 
{ flag = mid;break;} // 查 找 成 功 ,元 素 位 置 设置 到 flag 中 


} 


return flag; 
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例 7.1 有 序 表 按 关键 字 排 列 如 下 : 
7,14,18,21,23,29,31,35,38,42,46,49,52 


写 出 在 表 中 查找 关键 字 为 14 和 22 的 数据 元 素 的 过 程 。 
(1) 查找 关键 字 为 14 的 过 程 如 图 7. 1 所 示 。 


0 1 2 3 4 5 6 7 8 9 10 11 12 13 
7 |14 |18 |121|123 12 131 | 35 |38 |42 |46 |49 15 
不 

low=1 名 设置 初始 区 间 high=13 
mid=7 比较 测试 
iow=i high=6 high=mid-1， 调 整 到 左 半 区 
' @ 表 空 测试 ， 非 空 
mid=3 @ 得 到 中 点 ， 比 较 测 试 
由 
low=1 high=2 high=mid-1， 调 整 到 左 半 区 
D) 表 空 测试 ， 非 空 
mid=1 @ 得 到 中 点 ， 比 较 测 试 
low=2 high=2 low=mid+1， 调 整 到 右 半 区 
加 表 空 测试 ， 非 空 
mid=2 加 得 到 中 点 ， 比 较 测 试 
查找 成 功 ， 返 回 找到 的 数据 元 素 位 置 为 2 
图 7.1 查找 关键 字 为 14 的 过 程 


(2) 查找 关键 字 为 22 的 过 程 如 图 7. 2 所 示 。 


0 1 


> 


3 


4 


5 


6 学 


8 9 10 11 12 13 


加 四 回回 回回 加 站 回回 区 » | = 


low=1 设置 初始 区 间 
外 表 空 油 
mid=7 鲜 得 到 中 点 
low=1 high=6 high=mid-1， 调 整 到 左 半 区 
人 @@ 表 空 测试 ， 非 空 
mid=3 图 得 到 中 点 ， 比 较 测 试 
+ 
low=4 high=6 low=mid+1， 调 整 到 右 半 区 
回 表 空 测试 ， 非 空 
mid=5 @ 得 到 中 点 ， 比 较 测试 
low=4 high=4 high=mid-1， 调 整 到 左 半 区 
D 表 空 测试 ， 非 空 
mid=4 图 得 到 中 点 ， 比 较 测试 


查找 不 成 功 ， 返 回 0 


图 7.2 查找 关键 字 为 22 的 过 程 


性 能 分 析 : 

从 折 半 查找 过 程 看 ,以 表 的 中 点 为 比较 对 象 ,并 以 
中 点 为 界 将 表 分 割 为 两 个 子 表 , 对 定位 到 的 子 表 继 续 这 
种 操作 。 所 以 ,对 表 中 每 个 数据 元 素 的 查找 过 程 ,可 以 
用 二 叉 树 来 描述 , 称 这 个 描述 查找 过 程 的 二 叉 树 为 判定 
树 。 例 7. 1 折 半 查找 过 程 对 应 的 判定 树 如 图 7. 3 所 示 。 

可 以 看 到 ,查找 表 中 任 一 元 素 的 过 程 ,恰好 是 在 判定 
树 中 走 了 一 条 从 根 到 该 元 素 结 点 的 路 径 。 和 给 定 值 比 较 图 7.3 例 7.1 折 半 查 找 过 程 
的 结 点 关键 字 的 个 数 , 也 即 该 元 素 结 点 在 树 中 的 层次 数 。 对 应 的 判定 树 
对 于 及 个 结 点 的 判定 树 , 树 高 为 k, 则 有 2” 一 1=<n 达 
2 一 1, 即 一 1 过 lb 十 1) 才 ,所 以 =lb(x 十 1) |。 因此 , 折 半 查找 在 查找 成 功 时 ,所 进行 
的 关键 字 比 较 次 数 至 多 为 [lb(z 十 1) ]。 

接 下 来 讨论 折 半 查找 的 平均 查找 长 度 。 为 便于 讨论 ,以 树 高 为 k 的 满 二 叉 树 (n= 二 2* 一 1) 


为 例 。 假 设 表 中 每 个 元 素 的 查找 是 等 概率 的 , 即 忆 ,一 二 , 则 树 的 第 i 层 有 2 一 : 个 结 点 , 因 
此 , 折 半 查找 的 平均 查找 长 度 为 : 
ASL= DP, Ci =X2 +2X2 + 2) 


lb(n+1)—1 寺 lb(n 十 1) 一 1 
所 以 , 折 半 查找 的 时 间 效 率 为 O(lbn)。 


7.2.4 有 序 表 的 插值 查找 和 斐 波 那 契 查找 
1. 插值 查找 
插值 查找 通过 下 列 公式 


» kx— tbl. elem[ low|]. key 
mid = low + 


tbl. elemLhighj. key — tbl. eleml[ low |]. key 
求 取 中 点 ,其 中 low 和 high 分 别 为 表 的 两 个 端点 下 标 ,kx 为 给 定 值 。 

(1) 若 kx 过 tbl. elem[ mid]. key, 则 high 二 mid 一 1 ,继续 左 半 区 查找 ; 

(2) 若 kx>tbl. elemLmid]. key: 则 low 王 mid 十 1 ,继续 右 半 区 查找 ; 

(3) 若 kx 一 tbl.elem[Lmid]. key, 则 查找 成 功 。 

插值 查找 是 平均 性 能 最 好 的 查找 方法 ,但 只 适合 于 关键 字 均 匀 分 布 的 表 , 其 时 间 效 率 依 
然 是 O(lbn)。 


2. 斐 波 那 契 查找 


斐 波 那 契 查 找 是 通过 斐 波 那 契 数列 对 有 序 表 进行 分 割 , 查 找 区 间 的 两 个 端点 和 中 点 都 
与 斐 波 那 契 数 有 关 。 斐 波 那 契 数 列 定义 如 下 : 


n n 一 0 或 nn 二 1 
F(n)= 
Fl(n—1)++F(n—2) 7 人 2 


(high 一 low) 


224 


SN 


算法 与 数据 结构 (第 三 版 ) 


设 n 个 数据 元 素 的 有 序 表 , 且 n 正好 是 某 个 斐 波 那 契 数 一 1, 即 2 一 FC) 一 1 时 ,可 用 此 
查找 方法 。 

斐 波 那 契 查 找 分 割 的 思想 为 : 对 于 表 长 为 F(i) 一 1 的 有 序 表 , 以 相对 low 偏 移 量 
F(i 一 1) 一 1 取 中 点 , 即 mid 二 low 十 F(i 一 1) 一 1, 对 表 进 行 分 割 , 则 左 子 表 表 长 为 F(i 一 1) 一 
1, 右 子 表 表 长 为 F(i) 一 1 一 [F(i 一 1) 一 1] 一 1=F(i 一 2) 一 1。 可 见 , 两 个 子 表 表 长 也 都 是 
某 个 辈 波 那 契 数 一 1, 因 而 ,可 以 对 子 表 继续 分 割 。 

算法 7.3 ” 斐 波 那 契 查找 算法 。 


(1) low=1; high=F(k)—1; // 设 置 初始 区 间 
F=F(k)—1; {=F(k—1)—1; //F 为 表 长 ,f 为 取 中 点 的 相对 偏 移 量 
(2) 当 low>high 时 ,返回 查找 失败 信息 // 表 空 ,查找 失败 
(3) low<high,mid 一 low 十 fi; // 取 中 点 
O@ 若 kx 二 tbl. elem[midj. key, 则 
p=f; {=F—{—1; // 计 算 取 中 点 的 相对 偏 移 量 
F=p; // 调 整 表 长 F 
high 二 mid 一 1; 转 (2) // 查 找 在 左 半 区 进行 
@ 若 kx>tbl.elem[Lmid]. key, 则 
F=F—{—1; // 调 整 表 长 F 
{={—F—1; // 计 算 取 中 点 的 相对 偏 移 量 
low 二 mid 十 1; 转 (2) // 查 找 在 右 半 区 进行 
@ 若 kx=tbl.elemLmid]. key, 则 返回 数据 元 素 在 表 中 位 置 // 查 找 成 功 


当 n 很 大 时 ,该 查找 方法 称 为 黄金 分 割 法 ,其 平均 性 能 比 折 半 查找 好 ,但 其 时 间 效 率 仍 
为 O(lbz) ,而 且 , 在 最 坏 情况 下 性 能 比 折 半 查找 差 ,其 优点 是 计算 中 点 仅 做 加 ` 减 运算 。 


7.2.5 分 块 查找 


分 块 查找 又 称 索引 顺序 查找 ,是 对 顺序 查找 的 一 种 改进 。 分 块 查找 要 求 将 查找 表 分 成 
若干 个 子 表 ,每 个 子 表 满 足 分 块 有 序 ,并 对 子 表 建立 索引 表 。 查 找 表 的 每 一 个 子 表 由 索引 表 
中 的 索引 项 确定 。 所 谓 分 块 有 序 ,是 指 第 二 个 子 表 中 所 有 记录 的 关键 字 均 大 于 第 一 个 子 表 
中 的 最 大 关键 字 , 第 三 个 子 表 中 所 有 记录 的 关键 字 均 大 于 第 二 个 子 表 中 的 最 大 关键 字 , 以 此 
类 推 。 索 引 项 包括 关键 字 字段 (存放 对 应 子 表 中 的 最 大 关键 字 值 ) 和 指针 字段 (存放 指向 对 
应 子 表 的 第 一 个 元 素 指针 ) .并 且 要 求索 引 项 按 关键 字 字段 有 序 。 查 找 时 , 先 用 给 定 值 kx 
在 索引 表 中 检测 索引 项 ,以 确定 所 要 进行 的 查找 在 查找 表 中 的 查找 分 块 (由 于 索引 项 按 关键 
字 字段 有 序 ,可 用 顺序 查找 或 折 半 查找 ) ,然后 ,再 对 该 分 块 进行 顺序 查找 。 

例 7.2 ”关键 字 排 列 为 : 

88,43,14,31,78,8,62,49,35,71,22,83,18,52 

按 关 键 字 值 31,62,88 分 为 三 块 建立 的 查找 表 及 其 索引 表 如 图 7.4 所 示 。 

性 能 分 析 : 

分 块 查找 由 索引 表 查 找 和 子 表 查 找 两 步 完 成 。 设 n 个 数据 元 素 的 查找 表 分 为 m 个 子 


表 , 且 每 个 子 表 均 为 + 个 元 素 , 则 :一 | 忆 |。 这 样 ,分 块 查找 的 平均 查找 长 度 为 


二 
邮 
只 
洲 


关键 码 字段 
指针 字段 


图 7.4 分 块 查找 示例 


1 1 1 
ASL 一 ASLeam 二 ASLz# 一 元 (中 十 1) 十 本 他 +1) 3 (m 二 )+1 


可 见 ,平均 查找 长 度 不 仅 和 表 的 总 长 度 有关, 而且 和 所 分 的 子 表 个 数 mx 有关。 在 表 
长 确定 的 情况 下 ,m 取 w 时 ,ASL=Vz 十 1 达到 最 小 值 。 


(.3 动态 查找 表 


7.3.1 二 又 排序 树 
1. 二 叉 排 序 树 定义 


二 叉 排序 树 C(binary sort tree) 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 性 质 的 二 又 树 。 

(1) 若 左 子 树 不 空 , 则 左 子 树 上 所 有 结 点 的 值 均 小 于 根 结 点 的 值 ; 若 右 子 树 不 空 , 则 右 
子 树 上 所 有 结 点 的 值 均 大 于 根 结 点 的 值 。 

(2) 左右 子 树 也 都 是 二 又 排序 树 。 


图 7. 5 是 一 棵 二 叉 排序 树 示 例 ,可 以 看 出 ,对 二 叉 排 @ 
序 树 进行 中 根 遍 历 , 便 可 得 到 一 个 按 关 键 字 有 序 的 序列 。 
因此 ,一 个 无 序 序列 ,可 通过 构造 一 棵 二 叉 排序 树 而 (55) (90) 
成 为 有 序 序列 。 
二 叉 排 序 树 常 以 二 叉 链 表 作 为 存储 结构 。 
typedef int keytype; pe 
typedef struct node 图 7.5 一 棵 二 又 排序 树 示例 
{ 
keytype key; // 关 键 字 
struct node * rchild, * lchild; 
}bstnode; 


2. 二 又 排序 树 的 查找 过 程 


从 二 叉 排 序 树 的 定义 可 见 , 二 叉 排 序 树 的 查找 过 程 为 : 

(1) 若 查找 树 为 空 ,查找 失败 。 

(2) 若 查找 树 非 空 ,将 给 定 值 kx 与 查找 树 的 根 结 点 关键 字 比 较 。 
(3) 若 相 等 , 则 查找 成 功 ,结束 查找 过 程 ,否则 : 
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@ 当 给 定 值 kx 小 于 根 结 点 关键 字 , 查 找 将 在 以 左 孩 子 为 根 的 子 树 上 继续 进 
@ 当 给 定 值 kx 大 于 根 结 点 关键 字 , 查 找 将 在 以 右 孩 子 为 根 的 子 树 上 继续 进 
二 叉 排序 树 的 查找 过 程 如 算法 7.4 所 示 。 

算法 7.4 二 又 排序 树 的 查找 算法 。 


bstnode * search(bstnode *t,keytype key) // 在 二 叉 排 序 上 查找 键 值 为 key 的 结 点 
{ 


, 转 (1) 。 


行 
行 , 转 (1) 。 


bstnode *xp=t; 


while(p) 
{ 
if(p—> key== key) return p; // 找 到 ,返回 该 结 点 的 指针 
if(p—>key> key) 
p=p->1child; // 沿 着 某 条 搜索 路 径 寻 找 


elsep= Dp-> ohild; 

} 

return NULL; // 没 找到 ,返回 NULL 
} 


3. 二 叉 排序 树 的 插入 操作 和 构造 二 叉 排 序 树 


首先 讨论 向 二 叉 排序 树 中 插入 一 个 结 点 的 过 程 : 设 待 插入 结 点 的 关键 字 为 kx, 为 将 其 
插入 , 先 要 在 二 叉 排 序 树 中 进行 查找 , 若 查找 成 功 , 则 按 二 又 排序 树 定义 , 待 插入 结 点 已 存 
在 ,不 用 插入 ; 若 查找 不 成 功 , 则 插入 结 点 。 因 此 ,新 插入 结 点 一 定 是 作为 叶子 结 点 添加 上 
去 的 。 

例 7.3 记录 的 关键 字 序列 为 : 63,90,70,55,67,42,98,83,10,45,58, 请 写 出 构造 一 棵 
二 叉 排序 树 的 过 程 。 

这 棵 二 又 排序 树 的 构造 过 程 如 图 7.6 所 示 。 


rh 


图 7.6 从 空 树 开始 建立 二 叉 排序 树 的 过 程 


算法 7.5 


bstnode * insert(bstnode x t,keytype key) 
{ 

bstnode * p=t; 

bstnode * parent = p; 


while(p) 
{ 
parent = p; 
if(p—>key== key) return t; 


p=p->key> key?p—> lchild:p—> rchild; 


. 
= (bstnode * )malloc(sizeof(bstnode)); 
p->key= key; 
p->1child= p-> rchild= NULL; 
if(t== NULL) 
t=p; 
else if((parent 一 > key)< key) 
Parent 一 > rchild=p; 
else parent -> lchild= p; 
return 七 7 
}bstnode * creat(bstnode x*t) 
{ 
keytype key; 
FILE* fp; 


if( (fp= fopen("inputfile. txt", "r")) == NULL) 


{ 


二 又 排序 树 的 结 点 插入 及 生成 算法 。 


// 在 二 又 排序 树 上 中 插入 键 值 为 key 的 结 点 


//parent 指针 ,最 终 记录 插入 位 置 的 双亲 
// 寻 找 插入 的 位 置 


// 记 录 结 点 的 双亲 
// 如 果 该 键 值 已 经 存在 , 则 不 插入 
// 沿 着 二 叉 排序 树 的 某 条 路 径 ,寻找 插入 点 


// 申 请 新 结 点 ,作为 待 插入 结 点 

// 新 结 点 键 值 为 key 

// 新 结 点 左右 孩子 为 空 

// 如 果 是 树 中 第 一 个 结 点 , 则 是 根 1 结 点 


// 如 果 新 结 点 键 值 比 双 亲 键 值 大 

// 新 结 点 是 双亲 的 右 孩 子 

// 否 则 ,是 双亲 的 左 孩 子 

// 返 回 二 叉 排序 树 的 根 结 点 的 指针 
// 从 文件 读 入 键 值 生成 二 叉 排 序 树 t 


printf("can't open the inputfile. txt file\n"); 


exit(0); 
} 
while( !feof (fp)) 
{ 
//printf(" 请 输入 新 结 点 的 键 值 :"); 
fscanf(fp," %d", gkey); 
t= insert(t, key); 


return t; 


4. 二 叉 排序 树 的 删除 操作 


// 在 二 又 排序 树 中 插入 新 结 点 


// 返 回 生成 的 二 叉 排序 树 的 根 结 点 的 指针 


从 二 叉 排序 树 中 删除 一 个 结 点 之 后 ,使 其 仍 能 保持 二 又 排序 树 的 特性 即 可 。 


设 待 删 结 点 为 * 
为 *f, 以 下 分 三 种 情况 进行 讨论 。 


(1) *P 结 点 为 叶 结 点 ,由 于 删 去 叶 结 点 后 不 影 
特性 ,所 以 ,只 需 将 被 删 结 点 的 双亲 结 点 的 相应 指针 域 改 为 空 指 


针 , 如 图 7.7 所 示 。 


(2) *p 结 点 只 有 右 子 树 p, 或 只 有 左 子 树 pl ,此 时 ,只 需 将 图 
Pr 或 pi 替换 xf 结 点 的 x*p 子 树 即 可 ,如 图 7.8 所 示 。 


p(Pp 为 指向 待 删 结 点 的 指针 ) ,其 双亲 结 点 


响 整 棵 树 的 D 


k 点 为 叶子 结 点 


前 前 际 操作 
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图 7.8 只 有 左 子 树 或 只 有 右 子 树 的 删除 操作 
(3) *p 结 点 既 有 左 子 树 Pl 又 有 布 子 树 P, ,可 按 中 根 遍 历 保持 有 序 进行 调整 。 


设 删除 * p 结 点 前 ,中 根 遍 历 序列 为 
@ P 为 F 的 左 孩子 时 ,…,P, 子 树 ,P,P,,S 子 树 ,Pi,Si 子 树 ,…,P,,S, 子 树 ,Pi ,Si 子 


树 ,F,…。 


Q@P 为 下 的 右 孩 子 时 ,…,F,P, 子 树 ,P,P,,S 子 树 ,Pi ,Si 子 树 ,…,P,,S, 子 树 ,P, , S， 


子 树 ,…。 


树 ,… 


则 删除 *p 结 点 后 ,中 根 遍历 序列 应 
QP 为 F 的 左 孩子 时 ,…,P ge 子 树 ,Pi,S 子 树 ,…,P,,S, 子 树 ,Pi ,Si 子 树 ， 


@P 为 下 的 右 孩子 时 ,…,F,P, 子 树 ,P,,S 子 树 ,Pi,Si 子 树 ,…,P, ,Ss 子 树 ,Pi ,Si 子 


有 两 种 调整 方法 : 

直接 令 * p 的 Pl 子 树 为 *f 相 应 的 子 树 ,而 *p 的 右 子 树 为 Pi 子 树 中 根 遍 历 的 最 后 
i 

Pw 结 点 的 直接 后 继 P, 或 直接 前 驱 ( 对 Pi 子 树 中 根 遍 历 的 最 后 一 个 结 点 ) 替 换 


p ee er P, 或 直接 前 驱 。 


图 7. 9 所 示 就 是 以 * p 结 点 的 直接 后 继 P, 替换 * p。 
算法 7.6 二 又 排序 树 删除 结 点 算法 。 


bstnode * dele(bstnode * t,keytype key) // 在 二 叉 排 序 树 t 中 删除 键 值 为 key 的 结 点 
{ 

bstnode * p, * parent; 

bstnode *q, *f; 


p=t; // 从 根 结 点 开始 
parent = p; //parent 记录 删除 结 点 的 双亲 
while(p) // 搜 索 待 删除 的 结 点 


{ 

if(p 一 > key== key)break; 

parent = p; // 记 录 待 删除 结 点 的 指针 

p= (p->key>key)?p-> lchild:p->zrchild; //p 沿 着 树 的 某 条 搜索 路 径 进行 搜索 
if(p== NULL) // 没 有 找到 结 点 
{ 

printf(" 无 法 找到 该 结 点 ,不 能 删除 !\n"); 


图 7.9 按 方 法 (2) 进 行 调整 的 图 示 


return t; 
} 
if(!p—->1childgg!p—> rchild) 
{ 
if(parent -> lchild== p) 
parent 一 > lchild = NULL; 
else parent — > rchild = NULL; 
free(p); 
return t; 
: 
if(!p->1childggp— > rchild) 
{ 
if(parent —> lchild== p) 
parent ~-> lchild=p->rchild; 
else parent -> rchild=Pp 一 > rchild; 
free(p); 
return t; 
} 
if(p—->1childgg!p—> rchild) 
{ 
if(parent —> lchild== p) 
parent 一 > lchild=p—->1child; 
else parent ~ > rchild= p—> lchild; 
free(p); 
return t; 
} 
if(p—>1childggp— > rchild) 
{ 
q=Pp; 
f=p; 
p=p->rchild; 
while(p—> lchild) 


// 如 果 P 是 叶子 结 点 


// 修 改 P 的 双亲 指针 

// 若 p 是 双亲 的 左 孩 子 , 则 双亲 的 左 孩 子 置 空 
// 和 否则 ,双亲 的 右 孩 子 置 空 

// 删 除 结 点 了 


// 如 果 p 有 一 个 右 孩 子 


// 若 p 是 双亲 的 左 孩子 

// 将 p 的 右 孩 子 作为 双亲 的 左 孩 子 
// 否 则 ,将 p 的 右 孩 子 作 为 双亲 的 右 孩 子 
// 删 除 结 点 p 


// 如 果 p 有 一 个 左 孩 子 


// 若 p 是 双亲 的 左 孩子 

// 将 p 的 左 孩 子 作为 双亲 的 左 孩 子 

// 和 否则 ,将 p 的 左 孩子 作为 双亲 的 右 孩 子 
// 删 除 结 点 p 


// 如 果 P 有 两 个 孩子 , 则 删除 p 的 中 序 后 继 结 点 


// 保 存 待 删除 结 点 

// 最 终 王 是 待 删除 结 点 q 的 中 序 后 继 p 的 双亲 
// 转 向 p 的 右 子 树 , 寻 找 中 序 后 继 结 点 

// 在 p 的 右 子 树 上 ,寻找 最 左下 的 结 点 
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f=p; //E 记录 着 待 搜索 结 点 的 双亲 指针 
p=p->1child; // 指 针 p 沿 着 左 孩 子 链 向 前 
} 
// 循 环 结束 ,指针 p 指向 q 的 中 序 后 继 结 点 
q->key=p 一 >key; // 保 存 中 序 后 继 结 点 的 值 
if(!p—-> 1childgg&!p—> rchild) // 著 结 点 p 是 叶子 


i 
if(f->rchild== p)f -> rchild= NULL; // 将 双亲 结 点 的 相应 指针 置 空 
else if(f-> lchild== p)f —> lchild= NULL; 


free(p); // 删 除 结 点 p 
return t; 
else if(p-> rchild) // 若 结 点 有 右 孩 子 , 则 该 结 点 肯定 没有 左 孩子 


{ 

if(f ->1child==p) 
f->lchild=p->rchild;  // 若 p 是 f 的 左 孩 子 
// 则 的 左 孩 子 为 p 的 右 孩 子 

elsef->rchild=p->zrchild;  // 香 则 ,上 的 右 孩 子 为 p 的 右 孩子 
free(p); // 删 除 结 点 p 
return 七 ; 

上 

} 


return t; 
上 
对 给 定 的 序列 建立 二 叉 排序 树 , 若 左右 子 树 均匀 分 布 , 则 其 查找 过 程 类 似 于 有 序 表 的 折 
半 查 找 。 但 若 给 定 序 列 原 本 有 序 , 则 建立 的 二 叉 排序 树 就 晓 化 为 单 链表 ,其 查找 效率 同 顺序 
查找 一 样 。 因 此 ,对 均匀 的 二 叉 排序 树 进 行 插入 或 删除 结 点 后 ,应 对 其 进行 调整 ,使 其 依然 
保持 均匀 。 


7.3.2 平衡 二 叉 树 


平衡 二 叉 树 (AVL 树 ) 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 性 质 的 二 又 排序 树 : 它 的 左 子 
树 和 右 子 树 都 是 平衡 二 又 树 , 且 左 子 树 和 右 子 树 高 度 之 差 的 绝对 值 不 超过 1 。 

图 7.10 给 出 了 两 棵 二 又 排序 树 ,每 个 结 点 旁边 所 注 数 字 是 以 该 结 点 为 根 的 树 中 左 子 树 
与 右 子 树 高 度 之 差 , 这 个 数字 称 为 结 点 的 平衡 因子 。 由 平衡 二 叉 树 定义 ,所 有 结 点 的 平衡 因 
子 只 能 取 一 1、0、1 三 个 值 之 一 。 若 二 叉 排 序 树 中 存在 这 样 的 结 点 ,其 平衡 因子 的 绝对 值 大 
于 1, 这 棵 树 就 不 是 平衡 二 叉 树 。 图 7. 10(a) 所 示 的 二 又 排序 树 就 不 是 平衡 二 又 树 。 

在 平衡 二 又 树 上 捅 入 或 删除 结 点 后 ,可 能 使 树 失去 平衡 ,因此 ,需要 对 失去 平衡 的 树 进 
行 平衡 化 调整 。 设 a 结 点 为 失去 平衡 的 最 小 子 树 根 结 点 ,对 该 子 树 进行 平衡 化 调整 归纳 起 
来 有 以 下 四 种 情况 。 


1. 左 单 旋转 


图 7. 11(a) 所 示 为 插入 前 的 子 树 。 其 中 ,B 为 结 点 a 的 左 子 树 ,D、E 分 别 为 结 点 < 的 左 
右 子 树 ,B.D\E 三 棵 子 树 的 高 均 为 h。 图 7.11(a) 所 示 的 子 树 是 平衡 二 叉 树 。 


(a) 非 平衡 二 叉 树 (b) 平衡 二 叉 树 
图 7.10 平衡 二 叉 树 示 例 


Es 


(a) 插入 前 (b) 插入 后 ， 调 整 前 (c) 调整 后 
图 7.11 左 单 旋转 示意 图 


在 图 7. 11(a) 所 示 的 树 上 搬入 结 点 x, 如 图 7.11(b) 所 示 。 结 点 x 插入 在 结 点 < 的 右 子 
树 E 上 ,导致 结 点 a 的 平衡 因子 绝对 值 大 于 1, 以 结 点 a 为 根 的 子 树 失 去 平衡 。 

调整 策略 如 下 : 调整 后 的 子 树 除了 各 结 点 的 平衡 因子 绝对 值 不 超过 1, 还 必须 是 二 又 排 
序 树 。 由 于 结 点 c 的 左 子 树 D 可 作为 结 点 a 的 右 子 树 ,将 结 点 a 为 根 的 子 树 调整 为 左 子 树 
是 B, 右 子 树 是 D, 再 将 以 结 点 a 为 根 的 子 树 调整 为 结 点 c 的 左 子 树 , 结 点 c 为 新 的 根 结 点 ， 
如 图 7.11(c) 所 示 。 

平衡 化 调整 操作 判定 方法 如 下 : 

沿 插入 路 径 检 查 三 个 点 a.c、E, 车 它们 处 于 “\” 直 线 上 的 同一 个 方向 , 则 要 做 左 单 旋转 ， 
即 以 结 点 c 为 轴 逆 时 针 旋转 。 


2. 右 单 旋转 


右 单 旋转 与 左 单 旋转 类 似 , 沿 插入 路 径 检查 三 个 点 a、c、E, 若 它们 处 于 “/” 直 线 上 的 同 
一 个 方向 , 则 要 做 右 单 旋转 , 即 以 结 点 c 为 轴 顺 时 针 旋转 ,如 图 7. 12 所 示 。 


3. 先 左 后 右 双向 旋转 


图 7. 13 所 示 为 插入 前 的 子 树 , 根 结 点 a 的 左 子 树 比 右 子 树 高 度 高 1, 待 插入 结 点 x 将 
插入 到 结 点 b 的 右 子 树 上 ,并 使 结 点 b 的 右 子 树 高 度 增 1. 从 而 使 结 点 a 的 平衡 因子 的 绝对 
值 大 于 1 ,导致 结 点 a 为 根 的 子 树 平衡 被 破坏 ,如 图 7. 14(a) 和 图 7. 15(a) 所 示 。 

沿 插入 路 径 检查 三 个 点 a、.b、c, 车 它们 旦 “<” 字 形 , 需 要 进行 先 左 后 右 双 向 旋转 : 


算法 与 数据 结构 (第 三 版 ) 


1 
) 


-一 


0 = 
h 
1 
hIE DIh 
1 
(a) 插入 前 Cb) 插入 后 ， 调 整 前 (Cc) 调整 后 


图 7.12 右 单 旋转 示意 图 


一 一 = 一 一 | 


(a) 插入 后 ， 调 整 前 (b) 先 左旋 转 
图 7.14 先 左 后 右 双 向 旋转 示意 图 


一 一 = 一 一 


一、 一 一 一 | 


h—1 


i 
1 


G 


QQ 


(a) 插入 后 ， 调 整 前 (b) 先 左旋 转 (c) 再 右 旋转 
图 7.15 先 左 后 右 双 向 旋转 示意 图 2 


-一 六 一 一 | 


| 


第 7 章 ”查找 


(1) 对 以 结 点 b 为 根 的 子 树 , 以 结 点 c 为 轴 , 向 左 道 时 针 旋 转 , 结 点 c 成 为 该 子 树 的 新 
根 , 如 图 7.14(b) 和 图 7.15(b) 所 示 ; 

(2) 由 于 旋转 后 , 待 插入 结 点 x 相当 于 插入 到 以 结 点 b 为 根 的 子 树 上 ,这 样 a.c、b 三 点 
处 于 “/” 直 线 上 的 同一 个 方向 , 则 要 做 右 单 旋转 , 即 以 结 点 c 为 轴 顺 时 针 旋 转 , 如 图 7. 14(c) 
和 图 7.15(c) 所 示 。 


4. 先 右 后 左 双向 旋转 


先 右 后 左 双向 旋转 和 先 左 后 右 双 向 旋转 对 称 ,请 读者 自行 补充 整理 。 

在 平衡 二 又 排序 树 T 上 插入 一 个 关键 字 为 kx 的 新 元 素 ,递归 算法 可 描述 如 下 。 

(1) 若 工 为 空 树 , 则 插入 一 个 数据 元 素 为 kx 的 新 结 点 作为 工 的 根 结 点 , 树 的 深度 增 1 。 

(2) 若 kx 和 了 的 根 结 点 关键 字 相 等 , 则 不 进行 插入 。 

(3) 若 kx 小 于 工 的 根 结 点 的 关键 字 , 而 且 在 T 的 左 子 树 中 不 存在 与 kx 有 相同 关键 字 
的 结 点 , 则 将 新 元 素 插入 在 T 的 左 子 树 上 ,并 且 当 插入 之 后 的 左 子 树 深 度 增 加 1 时 ,分 别 就 
下 列 情况 进行 处 理 。 

@ T 的 根 结 点 平衡 因子 为 一 1( 右 子 树 的 深度 大 于 左 子 树 的 深度 ) , 则 将 根 结 点 的 平衡 
因子 更 改 为 0,T 的 深度 不 变 。 

@ T 的 根 结 点 平衡 因子 为 0( 左 , 右 子 树 的 深度 相等 ), 则 将 根 结 点 的 平衡 因子 更 改 为 
1,T 的 深度 增加 1 。 

GT 的 根 结 点 平衡 因子 为 1( 左 子 树 的 深度 大 于 右 子 树 的 深度 ) , 则 : 

。 若 工 的 左 子 树 根 结 点 的 平衡 因子 为 1, 需 进行 单 向 右 旋 平衡 处 理 ,并 且 在 右 旋 处 理 

之 后 ,将 根 结 点 和 其 右 子 树 根 结 点 的 平衡 因子 更 改 为 0, 树 的 深度 不 变 。 
。 若 工 的 左 子 树 根 结 点 平衡 因子 为 一 1, 需 进行 先 左 后 右 双向 旋转 平衡 处 理 , 并 且 在 旋 
转 处 理 之 后 ,修改 根 结 点 和 其 左右 子 树 根 结 点 的 平衡 因子 , 树 的 深度 不 变 。 

(4) 若 kx 大 于 工 的 根 结 点 关键 字 , 而 且 在 T 的 右 子 树 中 不 存在 与 kx 有 相同 关键 字 的 
结 点 , 则 将 新 元 素 插入 在 工 的 右 子 树 上 。 并 且 当 插入 之 后 的 右 子 树 深度 增加 1 时 ,分 别 就 
不 同情 况 进行 处 理 。 其 处 理 操作 和 (3) 中 所 述 相对 称 ,读者 可 自行 补充 整理 。 

算法 7.7 非 平衡 二 又 树 的 平衡 算法 。 


typedef struct NODE 
{ 


ElemType elem; // 数 据 元素 

int bf; // 平 衡 因 子 

struct NODE * lc, * rc; // 左 右 孩 子 指针 
}NodeType; // 结 点 类 型 


// 对 以 *p 指 向 的 结 点 为 根 的 子 树 ,做 右 单 旋转 处 理 ,处 理 之 后 , *p 指向 的 结 点 为 子 树 的 新 根 
void R_Rotate(NodeTYpe * *p) 
{ 

struct NODE * lp; 


lp=(*p)->1c; //lp 指向 *p 左 子 树 根 结 点 
(*p)->lc=1lp->zrc; //1lp 的 右 子 树 挂 接 * p 的 左 子 树 
lp->rc= *p; 

x*p= 1p; //*Pp 指 向 新 的 根 结 点 


上 
// 对 以 *p 指向 的 结 点 为 根 的 子 树 , 做 左 单 旋转 处 理 , 处 理 之 后 , * p 指向 的 结 点 为 子 树 的 新 根 
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void L Rotate(NodeType * * p) 


{ 
struct NODE * lp; 
lp= (*p)->rec; //lp 指向 * p 右 子 树 根 结 点 
(*p)->rc=1lp->lc; //lp 的 左 子 树 挂 接 * p 的 右 子 树 
lp->lc= *p; *p= 1p; //*p 指 向 新 的 根 结 点 

} 

#define LH 1 // 左 高 

#define EH 0 // 等 高 

#define RH —1 // 右 高 


// 对 以 *p 指 向 的 结 点 为 根 的 子 树 ,做 左旋 转 处 理 ,处 理 之 后 , *p 指向 的 结 点 为 子 树 的 新 根 
void LeftBalance(NodeType * *p) 


{ 
struct NODE * lp, * rd; 


int paller; 


lp=(*p)->1c; //lp 指 向 *p 左 子 树 根 结 点 
switch( ( * p) 一 > bf) // 检 查 * p 平 衡 度 ,并 做 相应 处 理 
{ 
case LH: // 新 结 点 择 在 *p 左 子女 的 左 子 树 上 , 需 做 单 右 旋转 处 理 


(*p)->bf= 1p-> bf= EH; 
R_Rotate(p); break; 
case EH: // 原 本 左 、 右 子 树 等 高 , 因 左 子 树 增高 使 树 增高 
(*p) ->bf= LH; 
paller = 1;break; 


case RH: // 新 结 点 插 在 *p 左 子女 的 右 子 树 上 , 需 做 先 左 后 右 双 旋 处 理 
rd=lp->rc; //rd 指向 *p 左 子女 的 右 子 树 根 结 点 
switch(rd— > bf) // 修 正 * p 及 其 左 子 女 的 平衡 因子 


case LH:( * p) ~- > bf = RH; lp — > bf = EH;break; 

case EH:( * p) -> bf = lp—> bf = EH;break; 

case RH:( * p) ~- > bf = EH; lp — > bf = LH;break; 
} 


rd 一 > bf = EH; 
L_Rotate(&((* p) ->1lc));  // 对 *p 的 左 子 树 做 左旋 转 处 理 
R_Rotate(p); // 对 *t 做 右 旋转 处 理 


} 
. 
// 若 在 平衡 的 二 叉 排序 树 t 中 不 存在 和 e 有 相同 关键 字 的 结 点 , 则 插入 一 个 数据 元 素 为 e 的 
// 新 结 点 ,并 返回 1, 否则 返回 0。 若 因 插 入 而 使 二 叉 排序 树 失去 平衡 , 则 做 平衡 旋转 处 理 
// 布 尔 型 变量 taller 反映 上 长 高 与 否 
int InsertAVL(NodeType * *t,ElemType ev int * taller) 
{ 
if(!( x*t)) // 插 入 新 结 点 , 树 "长 高 ", 置 taller 为 1 
{*t= (NodeType * )malloc(sizeof(NodeType)); 
(x*t)—>elem=e; 
(x*t)->lc=(*t)->rc=NOLL;(*t)—>bf=EH;*taller=1; 
l 
else 
{if(e.key== (*t) ->elem.key) // 树 中 存在 和 e 有 相同 关键 字 的 结 点 ,不 插入 
{taller = 0; return 0;} 
证 (e.key<(*t) -> elem.key) ”// 应 继续 在 *t 的 左 子 树 上 进行 
{ 
if(!InsertAVL(&(( *t) -> lc),evtaller)) 
return 0; // 未 插入 


if( * taller) // 已 插入 到 ( *t) 的 左 子 树 中 , 且 左 子 树 增高 
switch(( * t) 一 > bf) // 检 查 *t 平 衡 度 
{ 
case LH: // 原 本 左 子 树 高 , 需 做 左 平衡 处 理 
LeftBalance(t); * taller = 0;break; 
case EH: // 原 本 左 、 右 子 树 等 高 , 因 左 子 树 增高 使 树 增高 
(x*t)—->bf=LH; *taller=1;break; 
case RH: // 原 本 右 子 树 高 ,使 左右 子 树 等 高 


(x*t)—>bf=EH; *taller= 0;break; 


} 


else // 应 继续 在 *t 上 的 右 子 树 上 进行 
{ifE(!InsertRVL(&((*t) -> rc),evrtaller)) 
return 0; // 未 插入 
if( * taller) // 已 插入 到 (*t) 的 左 子 树 中 , 且 左 子 树 增高 
switch(( * t) -> bf) // 检 查 *t 平 衡 度 
+. 
case LH: // 原 本 左 子 树 高 ,使 左 、 右 子 树 等 高 
(*t)—>bf=EH; *taller=0; break; 
case EH: // 原 本 左 、 右 子 树 等 高 , 因 右 子 树 增高 使 树 增高 
(x*t)—>bf=RH; *taller=1;break; 
case RH: // 原 本 右 子 树 高 , 需 做 右 平衡 处 理 


RightBalance(t); * taller = 0;break; 


} 
} 


return 1; 


} 


平衡 树 的 查找 分 析 : 

在 平衡 树 上 进行 查找 的 过 程 和 二 叉 排 序 树 相 同 ,因此 ,在 查找 过 程 中 和 给 定 值 进 行 比较 
的 关键 字 个 数 不 超 过 树 的 深度 。 在 平衡 二 又 树 上 进行 查找 的 时 间 复 杂 度 为 O(lbn)。 

上 述 对 二 又 排序 树 和 二 叉 平 衡 树 的 查找 性 能 的 讨论 都 是 在 等 概率 的 前 提 下 进行 的 。 


7.3.3 B- 树 和 B+ 树 
1. B- 树 及 其 查找 


B- 树 是 一 种 平衡 的 多 路 查找 树 , 它 在 文件 系统 中 很 有 用 。 

定义 一 棵 x 阶 的 B- 树 ,或 者 为 空 树 ,或 者 为 满足 下 列 特性 的 m 叉 树 : 

(1) 树 中 每 个 结 点 至 多 有 m 棵 子 树 ; 

(2) 若 根 结 点 不 是 叶子 结 点 , 则 至 少 有 两 棵 子 树 ; 

(3) 除根 结 点 之 外 的 所 有 非 终 端 结 点 至 少 有 [m/2 ] 棵 子 树 ; 

(4) 所 有 的 非 终端 结 点 中 包含 信息 数据 (z ,Au .Ki,Ai,K,,….K,,A,), 其 中 kK,;(i= 
1,2,…,2) 为 关键 字 , 且 开 ; 志 Ki A; 为 指向 子 树 根 结 点 的 指针 (i 二 0,1,…,n), 且 指针 
A;_!1 所 指 子 树 中 所 有 结 点 的 关键 字 均 小 于 K; (i 二 1,2,…,n),A，, 所 指 子 树 中 所 有 结 点 的 
关键 码 均 大 于 KK， ,Tm/2 |—1<n<m—1,n 为 关键 字 的 个 数 。 

(5) 所 有 的 叶子 结 点 都 出 现在 同一 层次 上 ,并 且 不 带 信息 (可 以 看 作 是 外 部 结 点 或 查找 
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失败 的 结 点 ,实际 上 这 些 结 点 不 存在 ,指向 这 些 结 点 的 指针 为 空 )。 
例 7.4 图 7.16 所 示 为 一 棵 5 阶 的 B- 树 ,其 深度 为 4。 


3 79 84 93 
| | 


FI|FIIF| IF IF| IF oe ee 


图 7.16 一 棵 5 阶 的 B 树 


B- 树 的 查找 与 二 又 排序 树 的 查找 相 类 似 , 所 不 同 的 是 ,B- 树 每 个 结 点 上 都 是 多 关键 字 的 
有 序 表 ,在 到 达 某 个 结 点 时 , 先 在 有 序 表 中 查找 , 若 找 到 , 则 查找 成 功 ; 否则 ,到 按照 对 应 的 
指针 信息 指向 的 子 树 中 去 查找 , 当 到 达 叶 子 结 点 时 , 则 说 明 树 中 没有 对 应 的 关键 字 , 查 找 失 
败 。 因 此 ,在 B- 树 上 的 查找 过 程 是 一 个 沿 着 指针 查找 结 点 以 及 在 结 点 中 查找 关键 字 交 叉 进 
行 的 过 程 。 例 如 ,在 图 7. 16 中 查找 关键 字 为 93 的 元 素 。 首 先 ,从 t 指向 的 根 结 点 a 开始 ， 
结 点 a 中 只 有 一 个 关键 字 , 且 93 大 于 它 , 因 此 , 按 a 结 点 指针 域 A 到 结 点 c 去 查找 , 结 点 
有 两 个 关键 字 ,而 93 也 都 大 于 它们 ,应 按 c 结 点 指针 域 A 到 结 点 i 去 查找 ,在 结 点 i 中 顺 
序 比较 关键 字 ,找到 关键 字 天，。 

算法 7.8 B- 树 的 查找 。 

#define m 5 


typedef struct NODE 
{ 


//B 树 的 阶 , 暂 设 为 5 


int keynum; 
struct NODE * parent; 
KeyType key[m+1]; 
struct NODE * ptr[m+1]; 
record *recptr[m+1]; 
}NodeType; 

typedef struct 
NodeType * pt; 
int i; 
int tag; 
}Result; 


// 结 点 中 关键 字 的 个 数 , 即 结 点 的 大 小 
// 指 向 双亲 结 点 

// 关 键 字 向 量 ,0 号 单元 未 用 

// 子 树 指针 向 量 

// 记 录 指 针 向 量 

//B 树 结 点 类 型 


// 指 向 找到 的 结 点 

// 在 结 点 中 的 关键 字 序 号 , 结 点 序号 区 间 [1…m] 
//1: 查 找 成 功 ,0: 查 找 失败 

//B 树 的 查找 结果 类 型 


// 在 m 阶 B- 树 + 上 查找 关键 字 kx, 返 回 (pt, i,tag). 若 查找 成 功 , 则 tag=1 


// 指 针 pt 所 指 结 点 中 第 i 个 关键 字 等 于 kx 


// 否 则 ,特征 值 tag = 0, 等 于 kx 的 关键 字 记 录 应 插入 在 指针 pt 所 指 结 点 中 第 二 个 和 第 i+1 个 关键 


// 字 之 间 
Result SearchBTree(NodeType * t,KeyType kx) 
{ 

p= t;q= NULL;found = FALSE;i= 0; 

while( pg&! found) 

{ n=p->keynum;i= Search(p,kx); 


// 初 始 化 ,p 指向 待 查 结 点 ,q 指向 p 的 双亲 


// 在 p-->key[1…keynum] 中 查找 


if(i> 08S&p -> key[i] == kx) found = TRUE; // 找 到 
elsefq=pip=p->ptr[i];} 
} 


if(found) return (p,i,1); // 查 找 成 功 

else return (9q,i,0); // 查 找 不 成 功 ,返回 kx 的 插入 位 置信 息 
} 
查找 分 析 : 


B- 树 的 查找 是 由 两 个 基本 操作 交叉 进行 的 过 程 , 即 : 
(1) 在 B- 树 上 找 结 点 ; 
(2) 在 结 点 中 找 关键 字 。 
由 于 B- 树 通常 是 存储 在 外 存 上 的 ,操作 (1) 就 是 通过 指针 在 磁盘 上 相对 定位 ,将 结 点 信 
息 读 入 内存 ,然后 再 对 结 点 中 的 关键 字 有 序 表 进 行 顺序 查找 或 折 半 查找 。 由 于 在 磁盘 上 读 
取 结 点 信息 比 在 内 存 中 进行 关键 字 查找 耗 时 多 ,所 以 ,在 磁盘 上 读 取 结 点 信息 的 次 数 ( 即 B- 
树 的 层次 数 ) 是 决定 B- 树 查找 效率 的 首要 因素 。 
那么 ,对 含有 nn 个 关键 字 的 m 阶 B- 树 ,最 坏 情况 下 达到 多 深 呢 ?可 按 二 叉 平 衡 树 进行 
类 似 分 析 。 首 先 ,讨论 m 阶 B- 树 各 层 上 的 最 少 结 点 数 。 
由 B- 树 定义 可 知 ,第 一 层 至 少 有 1 个 结 点 ; 第 二 层 至 少 有 2 个 结 点 ; 由 于 除根 结 点 外 
的 每 个 非 终端 结 点 至 少 有 [zz/2 ] 棵 子 树 , 则 第 三 层 至 少 有 树 有 2(|m/2 ]) 个 结 点 ,以 此 类 
推 , 第 & 十 1 层 至 少 有 2([m/2 ]) 和 后: 个 结 点 。 而 A 十 1 层 的 结 点 为 叶子 结 点 。 车 m 阶 B- 树 
有 nn 个 关键 字 , 则 叶子 结 点 即 查找 不 成 功 的 结 点 为 n 十 1, 由 此 有 : 
n 二 +1 宇 2*x(m/2 |)" 
即 
& 魏 logwa (2 二 
这 就 是 说 ,在 含有 个 关键 字 的 B- 树 上 进行 查找 时 ,从 根 结 点 到 关键 字 所 在 结 点 的 路 


径 上 涉及 的 结 点 数 不 超过 logmwn (2 ) +1 个 。 


)+1 


2. B- 树 的 插入 和 删除 


1) 插入 

在 B- 树 上 插 人 关键 字 与 在 二 又 排序 树 上 插入 结 点 不 同 , 关 键 字 的 插入 不 是 在 叶 结 点 上 
进行 的 ,而 是 在 最 底层 的 某 个 非 终 端 结 点 中 添加 一 个 关键 字 。 若 该 结 点 上 关键 字 个 数 不 超 
过 m 一 1 个 , 则 可 直接 插入 到 该 结 点 上 ; 否则 ,该 结 点 上 关键 字 个 数 至 少 达到 m 个 ,因而 使 
该 结 点 的 子 树 超过 了 m 棵 ,这 与 B- 树 定义 不 符 。 所 以 要 进行 调整 , 即 结 点 的 分 裂 。 方 法 为 : 
关键 字 加 入 结 点 后 ,将 结 点 中 的 关键 字 分 成 三 部 分 ,使 得 前 后 两 部 分 关键 字 个 数 均 大 于 或 等 
于 [mm /2 | 一 1, 而 中 间 部 分 只 有 一 个 结 点 。 前 后 两 部 分 成 为 两 个 结 点 ,中 间 的 一 个 结 点 将 其 
插入 到 父 结 点 中 。 若 插入 父 结 点 而 使 父 结 点 中 关键 字 个 数 超过 mm 一 1, 则 父 结 点 继续 分 橡 ， 
直到 插入 某 个 父 结 点 ,其 关键 字 个 数 小 于 mx。 可 见 ,B- 树 是 从 底 向 上 生长 的 。 

例 7.5 就 下 列 关键 字 序 列 ,建立 5 阶 B- 树 ,如 图 7.17 所 示 。 

20,54,69,84,71,30,78,25,93,41,7,76,51,66,68,53,3,79,35,12,15,65 


t 
一 上 -| 20 —=| 20 54 69 84 
(a) 插入 20 后 (b) 插入 54，69，84 后 
69 
< 一 | 的 
20 25 30 54 71 78 84 93 
20 54 71 84 
(c) 插入 71 后 (d) 插入 30，78，25，93 后 
t 
一 一 30 69 
20 25 41 54 71 78 84 93 
(e) 插入 41 后 


二 一 人 30, 69 78 


7 20 25 | 41 54 | 71 76 84 93 


(插入 7，76 后 


~ 30 54 ,69 78 ~ 


~ 


7 20 25 | 41 51 | 66 68 | 71 76 84 93 


(g) 插 入 51，66，68 后 


一 一 54 


12, 30 69 .78 


-Rr | 20 25 35 41 51 53 66 68 | 71 76 79 84 93 


(h) 插入 53，3，79，35，12，15，65 后 
图 7.17 建立 B- 树 的 过 程 


(1) 向 空 树 中 插入 20, 得 到 图 7. 17(a)。 

(2) 插入 54,69,84, 得 到 图 7. 17(b)。 

(3) 插入 71, 索 引 项 达到 5, 要 分 裂 成 三 部 分 : {20.54).{69} 和 {71,84}) ,并 将 69 上 升 到 
该 结 点 的 父 结 点 中 ,如 图 7.17(c) 所 示 。 

(4) 插入 30,78,25,93, 得 到 图 7.17(d) 。 

(5) 插入 41, 又 分 裂 得 到 图 7. 17(e) 。 

(6) 7 直接 插入 。 

(7) 插入 76 ,分 裂 得 到 图 7.17(f) 。 


(8) 51,66 直接 插入 , 当 插入 68 时 ,需要 分 裂 , 得 到 图 7.17(g) 。 

(9) 53,3,79,35 直接 插入 ,12 插入 时 , 需 分 裂 ,但 中 间 关 键 字 12 插入 父 结 点 时 ,又 需要 
分 裂 , 则 54 上 升 为 新 根 。15 ,65 直接 插入 得 到 图 7. 17(h)。 

算法 7.9 在 B- 树 上 插入 关键 字 。 


int InserBTree(NodeType * *t,KeyType kx,NodeType * q, int i) 
{ 

KeyType x; 

x= kx;ap = NULL; finished = FALSE; 

while(q&&! finished) 

上 


Insert(q, i,x, ap); // 将 x 和 ap 分 别 插入 到 q->key[i+1] 和 q->ptr[i+1l] 
if(q—> keynum<m) 
finished = TRUE; // 插 入 完成 
else 
{ // 分 裂 结 点 *Pp 


s=m/2;split(q,ap);x=q-> key[s]; 
// 将 q->key[s+1…m],q->ptr[s…m] 和 9q->recptr[s+1…m] 移 人 新 结 点 * ap 
q=q-> parent; 
if(q) 
i= Search(q, kx); // 在 双亲 结 点 * q 中 查找 kx 的 插入 位 置 
} 
} 


if(!finished) //(*t) 是 空 树 或 根 结 点 ,已 分 型 为 *qx* 和 ap 
NewRoot (t, q, x, ap); // 生 成 含 信息 (t,x,ap) 的 新 的 根 结 点 *t, 原 *t 和 ap 为 子 树 指针 
} 
2) 删除 
删除 分 两 种 情况 。 


(1) 删除 最 底层 结 点 中 关键 字 。 

@ 若 结 点 中 关键 码 个 数 大 于 [> /2 1 一 1, 直 接 删 去 。 

@ 若 删除 后 , 余 项 与 左 兄弟 (无 左 兄 弟 , 则 找 右 兄 弟 ) 项 数 之 和 大 于 或 等 于 2(|m/2 | 一 1)， 
就 与 它们 父 结 点 中 的 有 关 项 一 起 重新 分 配 ,如 删 去 图 7. 17(h) 中 的 76 得 到 图 7. 18。 


12 30 69 ,7 9 


条 台 | 20 25 35 41 51 33 66 68 71 78 84 93 


图 7.18 B- 树 中 删除 关键 字 情 形 1 


@ 若 删除 后 , 余 项 与 左 兄弟 或 右 兄 弟 之 和 均 小 于 2([mm/2 | 一 1) ,就 将 余 项 与 左 兄弟 (无 
左 兄弟 时 ,与 右 兄 弟 ) 合 并 。 由 于 两 个 结 点 合并 后 , 父 结 点 中 相关 项 不 能 保持 ,把 相关 项 也 并 
和 人 合并 项 。 若 此 时 父 结 点 被 破坏 , 则 继续 调整 ,直到 根 。 如 删 去 图 7. 17 Ch) 中 7, 得 到 
图 7.19。 
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30 ,54 、69 


2 


3 12 20 25 | 35 41 51 53 66 68 71 76 79 84 9 | 


图 7.19 B- 树 中 删除 关键 字 情 形 2 


(2) 删除 非 底层 结 点 中 关键 字 。 

若 所 删除 关键 字 非 底层 结 点 中 的 KK;, 则 可 以 指针 A, 所 指 子 树 中 的 最 小 关键 字 X 替代 
天; ,然后 ,再 删除 关键 字 X, 直 到 这 个 X 在 最 底层 结 点 上 , 即 转 为 (1) 的 情形 。 

请 读者 自己 完成 删除 程序 。 


3. B+ 树 


B 十 树 是 应 文件 系统 所 需 而 产生 的 一 种 B- 树 的 变形 树 。 一 棵 mm 阶 的 B 十 树 和 m 阶 的 
B- 树 的 差异 在 于 : 

(1) 及 棵 子 树 的 结 点 中 含有 7 个 关键 字 ; 

(2) 所 有 的 叶子 结 点 中 包含 了 全 部 关键 字 的 信息 ,及 指向 含有 这 些 关 键 字 记录 的 指针 ， 
且 叶 子 结 点 本 身 按照 关键 字 的 大 小 自 小 而 大 的 顺序 链接 。 

(3) 所 有 的 非 终端 结 点 可 以 看 成 是 索引 部 分 , 结 点 中 仅 含 有 其 子 树 根 结 点 中 最 大 (或 最 
小 ) 关 键 字 。 

例如 ,图 7. 20 所 示 为 一 棵 4 阶 B 十 树 。 通 常 在 B 十 树 上 有 两 个 头 指针 : 一 个 指向 根 结 
点 ; 另 一 个 指向 关键 字 最 小 的 叶子 结 点 。 因 此 ,可 以 对 B 十 树 进行 两 种 查找 运算 : 一 种 是 从 
最 小 关键 字 起 顺序 查找 ; 另 一 种 是 从 根 结 点 开始 进行 随机 查找 。 


Sb | 2 35 4 51 53 1-| 6 68 | -| 84 93 


图 7.20 一 棵 4 阶 二 叉 树 


在 B 十 树 上 进行 随机 查找 插入 和 删除 的 过 程 基本 上 与 B- 树 类 似 。 只 是 在 查找 时 ,若非 
终端 结 点 上 的 关键 字 等 于 给 定 值 ,并 不 终止 ,而 是 继续 向 下 查找 直到 叶子 结 点 。 因 此 ,在 
B 十 树 上 ,不 管 查找 成 功 与 否 ,每 次 查找 都 是 走 了 一 条 从 根 到 叶子 结 点 的 路 径 。B 十 树 查 找 
的 分 析 类 似 于 B 树 。B 十 树 的 插入 仅 在 叶子 结 点 上 进行 , 当 结 点 中 的 关键 字 个 数 大 于 汉 
时 ,要 分 裂 成 两 个 结 点 ,它们 所 含 关键 码 的 个 数 均 为 -| 并 且 , 它 们 的 双亲 结 点 中 应 同 
时 包含 这 两 个 结 点 中 的 最 大 关键 字 。B 十 树 的 删除 也 仅 在 叶子 结 点 进行 , 当 叶 子 结 点 中 的 
最 大 关键 字 被 删除 时 ,其 在 非 终端 结 点 中 的 值 可 以 作为 一 个 “分 界 关 键 字 " 存 在 。 若 因 删 除 
而 使 结 点 中 关键 码 的 个 数 少 于 [m/2] 时 ,其 和 兄弟 结 点 的 合并 过 程 也 和 B- 树 类 似 。 


和 1 哈 希 表 查 找 


7.4.1 哈 希 表 与 哈 希 方法 


以 上 讨论 的 查找 方法 ,由 于 数据 元 素 的 存储 位 置 与 关键 字 之 间 不 存在 确定 的 关系 , 因 
此 ,查找 时 ,需要 进行 一 系列 对 关键 字 的 查找 比较 , 即 “查找 算法 ”是 建立 在 比较 的 基础 上 的 ， 
查找 的 效率 由 比较 一 次 缩小 的 查找 范围 所 决定 。 理 想 的 情况 是 依据 关键 字 直 接 得 到 其 对 应 
的 数据 元 素 位 置 , 即 关键 字 与 数据 元 素 之 间 存 在 一 种 对 应 关系 ,通过 这 个 关系 ,能 很 快 地 由 
关键 字 得 到 对 应 数据 元 素 的 位 置 。 

例 7.6 11 个 元 素 的 关键 字 分 别 为 18,27,1,20,22,6,10,13,41,15,25。 选 取 关 键 字 
与 元 素 位 置 间 的 函数 为 f(key) 二 key mod 11。 

(1) 通过 函数 f 对 11 个 元 素 建立 查找 表 如 图 7. 21 所 示 。 


0 1 2 3 4 5 6 7 8 9 10 


13 25 15 27 6 18 | 41 20 10 


图 7.21 由 函数 fkey) 建 立 的 查找 表 


(2) 查找 时 ,对 给 定 值 kx 依然 通过 这 个 函数 计算 出 地 址 ,再 将 kx 与 该 地 址 单元 中 元 素 
的 关键 字 比较 , 若 相 等 , 则 查找 成 功 。 

哈 希 表 与 哈 希 方法 : 选取 某 个 函数 , 依 该 函数 按 关 键 字 计 算 元 素 的 存储 位 置 ,并 按 此 存 
放 ; 查找 时 ,由 同一 个 函数 对 给 定 值 kx 计算 地 址 ,将 kx 与 地 址 单元 中 元 素 关键 字 进 行 比 
较 , 确 定 查找 是 否 成 功 ,这 就 是 哈 希 方法 (杂凑 法 ) 。 哈 希 方 法 中 使 用 的 转换 本 数 称 为 哈 希 画 
数 (或 杂凑 函数 ); 按 这 个 思想 构造 的 表 称 为 哈 希 表 ( 或 杂凑 表 ) 。 

对 于 ”个 数据 元 素 的 集合 ,总 能 找到 关键 字 与 存放 地 址 一 一 对 应 的 函数 。 若 最 大 关键 
字数 为 m, 且 可 以 分 配 m 个 数据 元 素 的 存储 空间 , 则 选取 函数 F(key) 王 key 即 可 ,但 这 样 会 
造成 存储 空间 的 很 大 浪费 ,甚至 不 可 能 分 配 这 么 大 的 存储 空间 。 通 常 关 键 字 的 集合 比 哈 希 
地 址 集合 大 得 多 ,因而 经 过 哈 希 函数 变换 后 ,可 能 将 不 同 的 关键 字 映 射 到 同一 个 哈 希 地 址 
上 ,这 种 现象 称 为 冲突 (collision) ,映射 到 同一 哈 希 地 址 上 的 关键 字 称 为 同义词 。 应 该 说 ， 
冲突 不 可 能 避免 ,只 能 尽量 减少 冲突 。 所 以 , 哈 希 方法 需要 解决 以 下 两 个 问题 。 

(1) 构造 好 的 哈 希 函数 。 

@ 所 选 函 数 尽 可 能 简单 ,以便 提高 转换 速度 。 

@ 所 选 函 数 对 关键 字 计 算出 的 地 址 ,应 在 哈 希 地 址 集中 大 致 均匀 分 布 ,以 减少 空间 
浪费 。 

(2) 制定 解决 冲突 的 方案 。 


7.4.2 常用 的 哈 希 方法 
1. 直接 定 址 法 


Hash(key) 一 a。key 十 b (a.b 为 常数 ) 
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即 取 关 键 字 的 某 个 线性 函数 值 为 哈 希 地 址 ,这 类 函数 是 一 一 对 应 函数 ,不 会 产生 冲突 ,但 要 
求 地 址 集合 与 关键 字 集 合 大 小 相同 ,因此 ,对 于 较 大 的 关键 字 集合 不 适用 。 

例 7.7 关键 字 集 合 为 {100,300,500,700,800.900} ,选取 哈 希 函数 为 Hash(key) 一 
key/100, 则 建立 哈 希 表 如 图 7. 22 所 示 。 


0 1 2 3 4 5 6 本 8 9 


| | 100 | | im | mm | 700 | 800 | 900 


图 7.22 例 7.7 所 建立 的 哈 希 表 


2. 除 留 余数 法 


Hash(key) 二 key mod p (p 是 一 个 整数 ) 
即 取 关键 字 除 以 p 的 余数 作为 哈 希 地 址 。 使 用 除 留 余数 法 ,选取 合适 的 p 很 重要 , 若 哈 
希 表 表 长 为 m, 则 要 求 bp 过 xm , 且 接 近 mm 或 等 于 m。 


3. 乘 余 取 整 法 


Hash(key) 王 Lb* (ax key mod 1)」 (ab 均 为 常数 , 且 0 二 a 二 1,b 为 整数 ) 
以 关键 字 key 乘 以 a, 取 其 小 数 部 分 (ax* key mod 1 就 是 取 ax key 的 小 数 部 分 ) ,之 后 再 用 
整数 b 乘 以 这 个 值 , 取 结果 的 整数 部 分 作为 哈 希 地 址 。 
该 方法 中 b 取 什么 值 并 不 关键 ,但 a 的 选择 却 很 重要 ,最 佳 的 选择 依赖 于 关键 字 集 合 的 


特征 。 一 般 取 (5 一 D 0， 618 033 9 较为 理想 。 


4. 数字 分 析 法 函数 


设 关键 字 集 合 中 ,每 个 关键 字 均 由 m 位 组 成 ,每 位 上 可 能 有 种 不 同 的 符号 。 

若 关键 字 是 4 位 十 进 制 数 , 则 每 位 上 可 能 有 十 个 不 同 的 数 符 0 一 9, 所 以 r= 二 10。 若 关键 字 
是 仅 由 英文 字母 组 成 的 字符 串 ,不 考虑 大 小 写 , 则 每 位 上 可 能 有 26 种 不 同 的 字母 ,所 以 ~ 一 26。 

数字 分 析 法 根据 x 种 不 同 的 符号 ,在 各 位 上 的 分 布 情况 ,选取 某 几 位 ,组 合成 哈 希 地 址 。 
所 选 的 位 应 满足 各 种 符号 在 该 位 上 出 现 的 频率 大 致 相同 。 

例 7.8 有 一 组 关键 字 如 下 : 


3 
3491487 
34826956 
3 5 20 
EE 
3498058 
3 
和 
DOO@OOOO 


第 1.2 位 均 是 3 和 4, 第 3 位 也 只 有 7、8、9, 因 此 ,这 几 位 不 能 用 ,余下 四 位 分 布 较 均匀 ， 
可 作为 哈 希 地 址 选用 。 若 哈 希 地 址 是 两 位 , 则 可 取 这 四 位 中 的 任意 两 位 组 合成 哈 希 地 址 ,也 
可 以 取 其 中 两 位 与 其 他 两 位 至 加 求 和 后 , 取 低 两 位 作为 哈 希 地 址 。 


5. 平方 取 中 法 
此 方法 对 关键 字 平 方 后 , 按 哈 希 表 大 小 , 取 中 间 的 若干 位 作为 哈 希 地 址 。 
6. 折 秋 法 


将 关键 字 自 左 到 右 分 成 位 数 相等 的 几 部 分 ,最 后 一 部 分 位 数 可 以 短 些 ,然后 将 这 几 部 分 
登 加 求 和 ,并 按 哈 希 表 表 长 , 取 后 几 位 作为 哈 希 地 址 ,这 种 方法 称 为 折 秋 法 (folding)。 

有 以 下 两 种 释 加 方法 。 

(1) 移 位 法 : 将 各 部 分 的 最 后 一 位 对 齐 相 加 。 

(2) 间 界 释 加 法 : 从 一 端 向 另 一 端 沿 各 部 分 分 界 来 回 折 伙 后 ,最 后 一 位 对 齐 相 加 。 


例 7.9 关键 字 为 key 二 05587463253, 设 哈 希 表 5 253 ] 
长 为 三 位 数 , 则 可 对 关键 字 每 三 位 一 部 分 来 分 隔 。 8 L387 ] 

关键 字 分 隔 为 如 下 四 组 。 253 463 587 05 二 0 

用 上 述 方法 计算 哈 希 地 址 ,如 图 7. 23 所 示 。 a ee 

对 于 位 数 很 多 的 关键 字 , 且 每 一 位 上 符号 分 布 较 。 (a) 移 位 法 (b) 间 界 释 加 法 
均匀 时 ,可 采用 此 方法 求 得 哈 希 地 址 。 图 7.23 折 知 法 计算 哈 希 地 址 

7.4.3 ”处理 冲突 的 方法 

1. 开放 定 址 法 


所 谓 开放 定 址 法 ,是 指 由 关键 字 得 到 的 哈 希 地 址 一 旦 产生 了 冲突 ,也 就 是 说 ,该 地 址 已 
经 存放 了 数据 元 素 , 就 去 寻找 下 一 个 空 的 哈 希 地 址 ,只 要 哈 希 表 足 够 大 , 空 的 哈 希 地 址 总 能 
找到 ,并 将 数据 元 素 存 人 。 

找 空 哈 希 地 址 方法 很 多 ,下 面 介绍 三 种 。 

1) 线性 探测 法 

H;=(Hash(key) +d;) modm (li<m) 
其 中 : Hash(key) 为 哈 希 函数 ; m 为 哈 希 表 长 度 ; di 为 增 量 序列 1,2,…,m 一 1, 自 dj; 二 i。 

例 7. 10 ”关键 字 集合 为 (47,7,29,11,16,92,22,8,3}, 哈 希 表 表 长 为 11, Hash(key) = 
key mod 11, 用 线性 探测 法 处 理 冲 突 , 建 表 如 图 7.24 所 示 。 


92 | 16 | 3|17|2|8 
人 A 六 去 
图 7.24 例 7.10 所 建立 的 哈 希 表 


47、7、11、16、92 均 是 由 哈 希 函数 得 到 的 没有 冲突 的 哈 希 地 址 而 直接 存 人 的 ; Hash(29) 一 7， 
哈 希 地 址 上 冲突 , 需 寻 找 下 一 个 空 的 哈 希 地 址 。 由 于 Hi 一 (Hash(29) 十 1)mod 11 一 8, 哈 
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希 地 址 8 为 空 ,将 29 存 人 。 另 外 ,22、8 同样 在 哈 希 地 址 上 有 冲突 ,也 是 由 互 ; 找到 空 的 哈 希 
地 址 的 。 

而 Hash(3) 一 3, 哈 希 地 址 上 有 冲突 ,由 于 互 , 一 (Hash(3) 十 1)mod 11 一 4, 仍 然 有 冲突 ; 
于 ,二 (Hash(3) 十 2)mod 11 一 5, 仍 然 有 冲突 ; 互 :=(Hash(3) 十 3)mod 11 王 6, 找 到 空 的 哈 
希 地 址 , 存 入 。 

线性 探测 法 可 能 使 第 i 个 哈 希 地 址 的 同义词 存 人 第 ;十 1 个 哈 希 地 址 ,这 样本 应 存 人 第 
i 十 1 个 喻 希 地 址 的 元 素 变 成 了 第 i 十 2 个 哈 希 地 址 的 同义词 …… 因此 ,可 能 出 现 很 多 元 素 
在 相 邻 的 喻 希 地 址 上 “堆积 ”起 来 ,大 大 降低 了 查找 效率 。 为 此 ,可 采用 二 次 探测 法 或 双 哈 希 
函数 探测 法 ,以 改善 “堆积 ”问题 。 

2) 二 次 探测 法 

H;=(Hash(key)+td;)modm 

其 中 : Hash(key) 为 哈 希 函数 ; m 为 喻 希 表 长 度 ,m 要 求 是 某 个 4 十 3 的 质数 (k 是 整数 ); 
d; 为 增 量 序列 1 ,一 1? ,2? ,一 2?,…,g’ ,一 g: 且 gm/2。 

仍 以 例 7. 10 用 二 次 探测 法 处 理 冲 突 , 建 表 如 图 7. 25 所 示 。 


0 2 3 4 » 6 学 8 9 10 
11 | 22 3 47 | 922 | 16 29 8 
人 A A A 


图 7.25 重建 例 7. 10 哈 希 表 


对 关键 字 寻 找 空 的 哈 希 地 址 只 有 3 这 个 关键 字 与 例 7. 10 不 同 ,Hash(3) 王 3, 哈 希 地 址 
上 有 冲突 。 由 于 有 H1 二 (Hash(3) 十 1)mod 11 一 4, 仍 然 有 冲突 ; Hs 二 (Hash(3) 一 1?)mod 
11 一 2, 找 到 空 的 哈 希 地 址 , 存 和 人 。 

3) 双 哈 希 函 数 探测 法 

H,;=(Hash(key)+i* ReHash(key))modm (i=1,2,."…,.m—1) 
其 中 : Hash(key)、ReHash(key) 是 两 个 哈 希 函数 ; m 为 喻 希 表 长 度 。 

双 哈 希 函 数 探测 法 先 用 第 一 个 函数 Hash(key) 对 关键 字 计 算 哈 希 地 址 ,一 旦 产生 地 址 
冲突 ,再 用 第 二 个 函数 ReHash(key) 确 定 移动 的 步 长 因子 ,最 后 ,通过 步 长 因子 序列 由 探测 
函数 寻找 空 的 哈 希 地 址 。 

例如 ,Hash(key) 二 a 时 产生 地 址 冲突 ,就 计算 ReHash(key)=b, 则 探测 的 地 址 序列 为 

Hi=(a+b)modm, H,=(a+2b)modm.,*…,.H, =(a+(m—1)b)modm 


2. 拉链 法 


设 哈 希 函 数 得 到 的 哈 希 地 址 域 在 区 间 [0,m 一 1] 上 ,以 每 个 哈 希 地 址 作为 一 个 指针 , 指 
向 一 个 链 , 即 分 配 指针 数组 ElemType * eptrL[m]; 建立 m 个 空 链表 ,由 哈 希 函数 对 关键 字 
转换 后 ,映射 到 同一 哈 希 地 址 i 的 同义词 均 加 入 到 * eptr[ 门 指向 的 链表 中 。 

例 7.11 关键 字 序 列 为 47,7,29,11,16,92,22,8,3,50,37,89,94,21, 哈 希 函 数 为 
Hash(key) 王 key mod 11。 用 拉链 法 处 理 冲突 , 建 表 如 图 7. 26 所 示 ( 向 链表 中 插入 元 素 均 
在 表 头 进行 ) 。 


37 | 才 =| 9 入 


© mJ a" hh wb 一口 


10| ”一 一 | 10 | 入 


图 7.26 拉链 法 处 理 冲突 时 的 哈 希 表 


3. 建立 一 个 公共 溢出 区 


设 哈 希 函 数 产 生 的 喻 希 地 址 集 为 [0,m 一 1], 则 分 配 两 个 表 : 一 个 是 基本 表 ElemType 
base_tbl[mj ,其 每 个 单元 只 能 存放 一 个 元 素 ; 另 一 个 是 溢出 表 ElemType over_tbl[kj], 只 
要 关键 字 对 应 的 哈 希 地 址 在 基本 表 上 产生 冲突 , 则 所 有 这 样 的 元 素 一 律 存 和 人 该 表 中 。 查 找 
时 ,对 给 定 值 kx 通过 哈 希 函数 计算 出 喻 希 地 址 i, 先 与 基本 表 的 base_tbl[i] 单 元 比较 ,车 相 
等 , 则 查找 成 功 ; 否则 ,再 到 溢出 表 中 进行 查找 。 


7.4.4 哈 希 表 的 查找 分 析 


哈 希 表 的 查找 过 程 基本 上 和 建 表 过 程 相 同 。 一 些 关 键 字 可 通过 哈 希 函数 转换 的 地 址 直 
接 找到 , 另 一 些 关 键 字 在 哈 希 函数 得 到 的 地 址 上 产生 了 冲突 ,需要 按 处 理 冲突 的 方法 进行 查 
找 。 在 介绍 的 三 种 处 理 冲突 的 方法 中 ,产生 冲突 后 的 查找 仍然 是 给 定 值 与 关键 字 进 行 比 较 
的 过 程 。 所 以 ,对 哈 希 表 查 找 效率 的 量度 ,依然 用 平均 查找 长 度 来 衡量 。 

查找 过 程 中 ,关键 字 的 比较 次 数 取 决 于 产生 冲突 的 多 少 。 产 生 的 冲突 少 ,查找 效率 就 
高 ; 产生 的 冲突 多 ,查找 效率 就 低 。 因 此 ,影响 产生 冲突 多 少 的 因素 ,也 就 是 影响 查找 效率 
的 因素 。 影 响 产生 冲突 多 少 有 以 下 三 个 因素 ， 

(1) 哈 希 函数 是 否 均匀 ; 

(2) 处 理 冲突 的 方法 ; 

(3) 哈 希 表 的 装填 因子 。 

分 析 这 三 个 因素 ,尽管 哈 希 函数 的 “好 坏 ” 直 接 影响 冲突 产生 的 频 度 , 但 一 般 地 ,总 认为 
所 选 的 哈 希 函数 是 “均匀 的 ”, 因 此 ,可 以 不 考虑 哈 希 函数 对 平均 查找 长 度 的 影响 。 就 线性 探 
测 法 和 二 次 探测 法 处 理 冲 突 的 例子 看 .相同 的 关键 字 集 合 、 同 样 的 哈 希 函数 ,但 在 数据 元 素 
查找 等 概率 情况 下 ,它们 的 平均 查找 长 度 却 不 同 : 

线性 探测 法 的 平均 查找 长 度 ASL 王 (5X1 十 3X2 十 1X4)/9 一 5/3 
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二 次 探测 法 的 平均 查找 长 度 ASL=(5X1 二 3X2 十 1X3)/9 王 14/9 
哈 希 表 的 装填 因子 定义 为 ; 
,二 填 人 表 中 的 元 素 个 数 
哈 希 表 的 长 度 

a 是 哈 希 表 装 满 程度 的 标志 因子 。 由 于 表 长 是 定 值 ,c 与 “ 填 入 表 中 的 元 素 个 数 ” 成 正 
比 , 所 以 ,a 越 大 , 填 人 表 中 的 元 素 较 多 ,产生 冲突 的 可 能 性 就 越 大 ; a 越 小 , 填 人 表 中 的 元 素 
较 少 ,产生 冲突 的 可 能 性 就 越 小 。 

实际 上 , 哈 希 表 的 平均 查找 长 度 是 装填 因子 a 的 函数 ,只 是 不 同 处 理 冲 突 的 方法 有 不 同 
的 函数 。 表 7. 2 给 出 几 种 处 理 冲 突 方法 的 平均 查找 长 度 。 


表 7.2 几 种 处 理 冲突 方法 的 平均 查找 长 度 


平均 查找 长 度 
处 理 冲突 的 方法 
查找 成 功 时 查找 不 成 功 时 
线性 探测 法 su~ 了 到 (+ ) Uu~ 冯 (1+r 
二 次 探测 法 与 双 哈 希 法 Su 二 InGl 一 o) Un 二 
拉链 法 Su~1 十 二 Uw ~ate™ 


喻 希 方法 存 取 速 度 快 ,也 较 节 省 空间 ,静态 查找 、 动 态 查 找 均 适 用 ,但 由 于 存 取 是 随机 
的 ,因此 ,不 便于 顺序 查找 。 


0.5 C++ 中 的 查找 
》A 


7.5.1 静态 查找 的 C++ 程序 


把 查找 对 象 作为 集合 看 待 . 例 7. 12 给 出 了 集合 的 抽象 模板 类 DynamicSet。 例 7. 13 定 
义 了 一 个 顺序 表 表 示 的 集合 类 ListSet, 作为 集合 类 的 派生 类 。 类 ListSet 的 查找 运算 如 
例 7.14 和 例 7.15 所 示 。 

例 7.12 类 DynamicSet。 


template < class T> 

class DynamicSet 

‘ 

public: 

virtual ResultCode Search(T& x)const = 0; 
virtual ResultCode Insert(T& x) = 0; 
Virtual ResultCode Remove(T& x) = 0; 
virtual bool IsEmpty()const= 0; 

virtual bool IsFull()const= 0; 

}; 


例 7.13 数据 元 素 集 合 类 ListSet。 


template < class T> 
class ListSet:public DynamicSet < 了 > 
{ 
public: 
ListSet( int mSize); 
一 ListSet(){delete []1;} 
bool IsEmpty()const{return n== 0;} 
bool IsFull()const{return n== maxSize;} 
ResultCode Search(T& x)const; 
ResultCode Search2(T& x)const; 
ResultCode Insert(T& x); 
ResultCode Remove( T& x); 
private: 
Tl; // 指 针 1 指向 一 个 一 维 数组 
int maxSize; 
int n; 


i 
例 7.14 顺序 查找 无 序 表 。 


template <class T> 
ResultCode ListSet <T>::Search(T& x)const 
{ 
for (int i=0;i<n;it+) 
if (1[i] ==x) { 
x= 1[i]; return Success; // 查 找 成 功 
” 
return NotPresent; // 查 找 失败 
} 


例 7.15 折 半 查找 的 非 递 归 算法 。 


template <class T> 
ResultCode ListSet <T>::Search2(T& x)const 
{ 
int m, low= 0,high=n-—1; 
while (low<= high){ 
m= (low + high) /2; 
if (x<1[m]) high=m-—1; 
else if (x>1[m]) low=m+1; 
else { 
x= 1[m];return Success; // 查 找 成 功 
} 
} 
return NotPresent; // 查 找 失 败 


7.5.2 动态 查找 的 C++ 程序 


借助 C++ 的 模板 抽象 类 来 定义 二 叉 排 序 树 抽象 数据 类 BSTree, 如 例 7. 16 所 示 , 例 7. 17 


几 


藻 
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是 二 又 排序 树 查 找 的 递归 算法 。 
例 7.16 二 又 排序 树 抽象 数据 类 BSTree。 


template < class T> 

class BSTree:public DynamicSet <T> 

{ 

public: 
BSTree( ) {root = NULL; } 
ResultCode Search(T& x)const; 
ResultCode Search2(T& x)const; 
ResultCode Insert(T& x); 
ResultCode Remove( T& x); 


protected: 
BTNode <T>* root; 
private: 
ResultCode Search(BTNode <T> *p,T& x)const; 


}; 
例 7.17 二 又 排序 树 查找 的 递归 算法 。 


template < class T> 
ResultCode BSTree <T>::Search(T& x)const 
{ 
return Search( root, x); 
} 
template < class T> 
ResultCode BSTree <T>::Search(BTNode <T> *p,T& x)const 
{ 
if (!p) return NotPresent; 
else if (x<p-> element) return Search(p 一 > 1Child, x); 
else if(x>p—->element) return Search(p 一 > rChild, x); 
else{ 
x=p-> element;return Success; 
. 
} 


GE， 


1. 画 出 对 长 度 为 10 的 有 序 表 进 行 折 半 查找 的 判定 树 , 并 求 其 等 概率 时 查找 成 功 的 平 
均 查 找 长 度 。 

2. 假设 按 下 述 递归 方法 进行 顺序 表 的 查找 : 若 表 长 小 于 或 等 于 10, 则 进行 顺序 查找 ， 
否则 进行 折 半 查找 。 试 画 出 对 表 长 n 二 50 的 顺序 表 进 行 上 述 查找 时 ,描述 该 查找 的 判定 
树 ,并 求 出 在 等 概率 情况 下 查找 成 功 的 平均 查找 长 度 。 

3. 一 组 有 序 的 关键 字 如 下 : 15,17,22,28,33,41,51,67,90。 设 法 画 出 一 棵 具有 平衡 
性 的 二 又 排序 树 。 如 果 对 每 一 个 关键 字 的 查找 概率 相等 ,计算 平均 查找 长 度 ASL。 进 一 步 


写 出 解决 该 问题 的 算法 。 提 示 : 以 中 间 位 置 元 素 为 根 。 
4. 已 知 下 列 关 键 字 和 它们 对 应 的 哈 希 函数 值 


key Zhao Sun Li Wang Chen Liu Zhang 


H(key) 6 5 7 4 1 6 4 


由 此 构造 哈 希 表 , 用 线性 探测 法 解决 冲突 ,计算 该 哈 希 表 的 装填 系数 a 和 平均 查找 长 度 
ASL。 若 用 拉链 法 解决 冲突 情况 又 如 何 ? 

5. 已 知 一 个 含有 1000 个 记录 的 表 , 关 键 字 为 中 国人 姓氏 的 拼音 ,请 给 出 此 表 的 一 个 哈 
希 表 设计 方案 ,要 求 它 在 等 概率 情况 下 查找 成 功 的 平均 查找 长 度 不 超过 3 。 

6. 试 编写 一 个 开放 地 址 法 解决 冲突 的 哈 希 表 删 除 算法 。 


(上 机 练习 3 


1. 编程 实现 ,在 一 个 无 序 表 A 中 ,采用 顺序 查找 算法 查找 值 为 x 的 元 素 ,返回 其 位 置 。 

2. 编写 一 个 算法 ,利用 二 分 查找 算法 在 一 个 有 序 表 中 插入 一 个 元 素 x, 并 保持 表 的 有 
序 性 。 
3. 编写 一 个 算法 , 求 出 利用 二 分 查找 算法 查找 任意 一 个 元 素 所 比较 的 次 数 。 
4. 设计 一 个 算法 , 读 和 人 一 串 整 数 ,构造 其 对 应 的 二 又 排序 树 ,并 在 其 上 删除 任意 一 个 值 
为 键盘 输入 的 结 点 。 

5. 使 用 险 希 函数 : H(k) 二 3k MOD 11, 并 采用 链 地 址 法 处 理 冲 突 。 试 对 关键 字 序列 
(22,41,53,46,30,13,01,67) 构 造 哈 希 表 , 求 等 概率 情况 下 查找 成 功 的 平均 查找 长 度 ,并 设 
计 构 造 哈 希 表 的 完整 的 算法 。 


排序 | 


本 章 学 习 要 点 

(1) 掌握 插 和 排序、 交换 排序 .选择 排序 .归并 排序 和 基数 排序 五 类 内 部 排序 方法 的 基 
本 思想 、 排 序 过 程 、 实 现 的 算法 ,算法 的 效率 分 析 及 排序 的 特点 ; 对 各 种 排序 方法 进行 比较 ; 

(2) 能 根据 各 种 内 部 排序 方法 的 优 缺 点 及 不 同 的 应 用 场合 选择 合适 的 方法 进行 排序 。 

排序 是 数据 处 理 中 经 常 运用 的 一 种 重要 运算 。 排 序 的 功能 是 将 一 个 数据 元 素 ( 记 录 ) 的 
任意 序列 ,重新 排列 成 一 个 按 关键 字 有 序 的 序列 ,其 目的 之 一 是 方便 查找 ,从 第 7 章 可 以 看 
到 ,有 序 的 顺序 表 可 以 采用 查找 效率 较 高 的 折 半 查找 ,而 无 序 的 顺序 表 只 能 用 查找 效率 较 低 
的 顺序 查找 法 。 又 如 建立 树 表 的 过 程 本 身 就 是 一 个 排序 过 程 。 因 此 ,学 习 和 研究 各 种 排序 
方法 有 很 重要 的 意义 。 


@.1 基本 概念 


在 学 习 排序 之 前 , 先 学 习 几 个 基本 术语 。 

关键 字 是 数据 元 素 中 某 个 数据 项 的 值 , 用 它 可 以 标识 一 个 数据 元 
素 。 通 常会 用 记录 来 表示 数据 元 素 ,一 个 记录 可 以 由 若干 个 数据 项 组 | 学 号 | 姓名 | 性 别 
成 。 例 如 : 一 个 学 生 的 信息 就 是 一 条 记录 , 它 包括 学 号 、 姓 名 、 性 别 等 
若干 数据 项 ( 见 图 8. 1)。 

主 关 键 字 是 可 以 唯一 地 标识 一 个 记录 的 关键 字 , 如 学 号 。 

次 关键 字 是 可 以 标识 若干 记录 的 关键 字 , 如 姓名 ,性 别 。 

假设 一 个 文件 有 nn 条 记录 {Ri,R,,…,R,}), 对 应 的 关键 字 是 {K, ,K,.,…,K,}) ,排序 就 
是 将 此 个 记录 按 关 键 字 的 大 小 递增 (或 递减 ) 的 次 序 排列 起 来 ,使 这 些 记录 由 无 序 变 为 有 
序 的 一 种 操作 。 排 序 后 的 序列 若 为 {Ra ,Ri ,…,R;) 时 ,其 对 应 的 关键 字 值 满足 {K, 过 
Ki RK,}( 或 {Ki 二 Ki 宇 ,*… ;二 K。,}))。 

车 在 待 排序 的 记录 中 ,存在 两 个 或 两 个 以 上 关键 字 相 等 的 记录 ,经 排序 后 这 些 记录 的 相 
对 次 序 仍然 保持 不 变 , 则 称 相应 的 排序 方法 是 稳定 的 方法 ,否则 是 不 稳定 的 方法 。 

根据 排序 过 程 中 涉及 的 存储 器 不 同 ,可 以 将 排序 方法 分 为 两 大 类 : 一 类 是 内 部 排序 , 指 
的 是 待 排序 的 记录 存放 在 计算 机 随机 存储 器 中 进行 的 排序 过 程 ; 另 一 类 是 外 部 排序 , 指 的 
是 排序 中 要 对 外 存储 器 进行 访问 的 排序 过 程 。 

内 部 排序 是 排序 的 基础 ,本 章 主要 讨论 内 部 排序 ,其 次 介绍 外 部 排序 。 在 内 部 排序 中 ， 


图 8.1 一 记录 结构 


根据 排序 过 程 中 所 依据 的 原则 可 以 将 它们 分 为 五 类 : 插入 排序 .交换 排序 .选择 排序 .归并 
排序 和 基数 排序 ; 根据 排序 过 程 的 时 间 复 杂 度 来 分 ,可 分 为 三 类 : 简单 排序 .先进 排序 、 基 
数 排序 。 
评价 排序 算法 优 劣 标准 主要 有 两 个 : 
(1) 算法 的 运算 量 ,主要 是 通过 记录 的 比较 次 数 和 移动 次 数 来 反映 ; 
(2) 执行 算法 所 需要 的 附加 存储 单元 的 多 少 。 
为 了 讨论 方便 起 见 ,假设 待 排序 的 一 组 记录 存放 在 地 址 连续 的 一 组 存储 单元 上 ,并 设 记 
录 的 关键 字 均 为 整数 ,定义 待 排序 的 记录 的 数据 类 型 为 : 
typedef struct 
{int key; 
elemtype data; 
}redtype; 
redtype r[n]; 
其 中 ,key 表示 主 关 键 字 域 ; data 表示 其 他 域 ; redtype 表示 记录 类 型 标识 符 。rL nj 表示 一 
个 redtype 类 型 的 待 排序 数组 。 


@.2 插入 排序 


插入 排序 的 基本 思想 是 : 每 步 都 将 一 个 待 排序 的 记录 , 按 其 关键 字 值 的 大 小 插入 到 前 
面 已 经 排序 的 文件 中 适当 的 位 置 上 ,直到 全 部 插入 完 为 止 。 


8.2.1 直接 插入 排序 


直接 插入 排序 是 一 种 简单 的 插入 排序 法 ,其 基本 思想 是 : 将 待 排 序 的 记录 按 其 关键 字 
的 大 小 逐个 插入 到 一 个 已 经 排 好 序 的 有 序 序列 中 去 ,直到 所 有 的 记录 插入 完 为 止 , 得 到 一 个 
新 的 有 序 序列 。 

例如 ,已 知 待 排序 的 一 组 记录 是 : 

60,71,49,11,82,24,3,66 
假设 在 排序 过 程 中 ,前 3 个 记录 已 按 关键 字 递 增 的 次 序 重新 排列 ,构成 一 个 有 序 序 列 : 
49,60,71 

现在 将 待 排序 记录 中 的 第 4 个 记录 ( 即 11) 插 入 上 述 有 序 序列 ,以 得 到 一 个 新 的 含 4 个 
记录 的 有 序 序列 。 首 先 ,应 找到 11 的 插入 位 置 , 再 进行 插入 。 可 以 将 11 放 入 数组 的 第 一 个 
单元 [0] 中 ,这 个 单元 称 为 监视 哨 , 然 后 从 71 起 从 右 到 左 查找 。11 小 于 71, 将 71 右 移 一 
个 位 置 ; 11 小 于 60, 又 再 将 60 右 移 一 个 位 置 ; 11 小 于 49 ,又 再 将 49 右 移 一 个 位 置 , 这 时 再 
将 11 与 ~[0] 的 值 比较 .11 三 r[0], 它 的 插入 位 置 就 是 ~[1]。 假 设 11 大 于 第 一 个 值 r[1]， 
它 的 插入 位 置 应 在 ~>L1] 和 [2] 之 间 , 由 于 60 已 右 移 了 , 膳 出 来 的 位 置 正 好 留 给 11。 后 面 
的 记录 依照 同样 的 方法 逐个 插入 到 该 有 序 序列 中 。 若 记录 数 为 2, 须 进行 2 一 1 趟 排序 , 才 
能 完成 。 下 面 用 图 8. 2 说 明 整 个 排序 过 程 。 

在 图 8. 2 中 ,i 表示 插入 记录 的 顺序 号 ,用 方 括 号 括 起 来 的 部 分 表示 已 排序 的 记录 。 


FF2 [1] [0 71] 49 11 82 4 3 66 


i3 [9] [49 60 7] 11 82 4 3 66 


FF4 [II [ll 49 60 7] 82 4 3 66 


i=5 [82] [ll 49 60 7 8] 4 3 66 
6 [49] [lll 49 49 60 7 8] 3 66 
£7 B] B 1 4 4 6 7 8] 66 
i=8 [6] B 11 4 4 60 6 7 82] 


+ 
监视 哨 [0] 
图 8.2 直接 插入 排序 示例 


在 排序 之 前 设置 了 ~[0],r[0] 称 为 监视 哨 , 它 的 作用 是 免 去 在 查找 过 程 的 每 一 步 都 要 
检测 数组 > 是 否 查找 结束 .下 标 是 否 越界 ,这 就 是 监视 哨 这 个 名 称 的 来 历 。 

图 8. 2 中 ,序列 60,71 称 为 第 一 趟 排序 。 可 见 整个 排序 过 程 是 由 若干 赵 排 序 构成 的 。 
若 记 录 数 为 n ,直接 插入 排序 应 由 双重 循环 来 实现 ,外 循环 进行 n 一 1 趟 插入 排序 ,内 循环 用 
于 进行 一 趟 插入 排序 , 即 进行 关键 字 的 比较 和 记录 的 后 移 , 完 成 某 一 记录 的 插 和 人 过程 。 直 接 
插入 排序 的 具体 算法 如 下 。 

算法 思路 : 

(1) 设置 监视 哨 ~[0], 将 待 插入 记录 的 值 赋 给 r[0]; 

(2) 设置 开始 查找 的 位 置 7 

(3) 在 数组 中 进行 搜索 ,搜索 中 将 第 j 个 记录 后 移 ,直至 [0]. key 宇 r[LjJ. key 为 止 ; 

(4) 将 r[0J] 插 入 xr[j 十 1 的 位 置 上 。 

算法 8.1 直接 插入 排序 算法 。 


void zjinsert(redtype r[ ], int n) 
上 


int i,j; 
for(i=2;i<n;it+) /人 /i 表示 插入 元 素 下 标 ,此 时 1..i-1 有 序 
{ 
j=i-1; /三 表示 比较 元 素 下 标 
r[0] =r[i]; // 设 置 监视 哨 , 将 其 设置 为 待 插入 的 结 点 
while(r[0].key <r[j].key) // 寻 找 插入 点 ,并 进行 元 素 的 移动 
{ 
r[j+1]=r[j]; // 前 一 结 点 向 后 移动 
tt 


r[j+1]=r[0]; // 插 入 待 排序 的 结 点 , 即 监视 哨 的 值 


分 析 上 述 算法 ,为 了 正确 地 插入 第 i 个 记录 ,最 多 比较 i 次, 最少 比较 1 次 ,平均 比较 i/2 
次 。 按 平均 比较 次 数 计算 ,将 n 个 记录 进行 直接 插入 排序 所 需 的 平均 比较 次 数 为 
> Kn》 (到 十 2 一 2) on 
人 4 4 4 
插入 排序 中 记录 的 移动 次 数 也 是 比较 多 的 ,用 与 上 面 类 似 的 方法 可 以 算出 ,插入 7 个 
记录 所 需 的 平均 移动 次 数 近 似 为 n*/4。 由 此 ,直接 插入 排序 的 时 间 复 杂 度 为 O(n?)。 
由 于 直接 插入 排序 在 整个 排序 过 程 中 只 需 一 个 记录 单元 的 辅助 空间 ,所 以 其 空间 复杂 


度 为 O(1)。 直 接 插入 排序 是 一 种 稳定 的 排序 方法 。 
8.2.2 希 尔 排序 


希 尔 排 序 又 称 为 “缩小 增 量 排序 ”, 也 是 一 种 插入 排序 类 的 算法 ,与 直接 插入 排序 相 比 ， 
在 时 间 效 率 上 有 和 较 大 的 改进 。 

希 尔 排 序 的 思路 是 : 选 定 第 一 个 增 量 di 二 n ,把 全 部 记录 按 此 值 从 第 一 个 记录 起 进行 
分 组 ,所 有 相距 为 di 的 记录 作为 一 组 。 先 在 各 组 内 进行 插入 排序 ; 然后 缩小 间隔 , 取 第 二 
个 增 量 ds 到 di ,重复 上 述 分 组 和 排序 过 程 ; 如 此 反复 ,直至 增 量 值 4d; 二 1 为 止 , 即 所 有 的 记 
录放 在 同一 组 内 排序 。 

对 于 每 一 趟 的 增 量 d; 可 以 有 多 种 取 法 。 希 尔 提 出 的 取 法 是 : dd; 三 n/2,di41 二 di;/2, 克 
努 特 (Knuth) 提 出 的 取 法 是 di41 二 4d;/3; 还 有 人 提出 别 的 取 法 。 这 里 ,用 希 尔 的 取 法 。 

例如 ,对 记录 数 n 等 于 8 的 序列 进行 希 尔 排序 。 图 8. 3 说 明了 这 一 过 程 , 其 中 ,各 趟 的 
增 量 值 分 别 为 4、2、1。 


d4 60 7 49 11 82 4 3 66 

[ Ir Ir 1 

2 60 4 3 11 82 71 49 66 
l 多 I | 

d=1 3 11 49 4 60 6 82 71 


结果 3 1 4 49 60 6 7 82 
图 8.3 和 希 尔 排序 示例 


希 尔 排序 算法 可 以 通过 三 重 循环 来 实现 。 

算法 思路 : 

(1) 外 循环 以 各 种 不 同 的 间隔 距离 d 进行 排序 ,直到 4d 一 1 为 止 。 

(2) 第 二 重 循环 是 在 某 一 个 d 值 下 对 各 组 进行 排序 , 若 在 某 个 d 值 下 发 生 了 记录 的 交 
换 , 则 需 继续 第 三 重 循环 ,直至 各 组 内 均 无 记录 的 交换 为 止 , 即 各 组 内 已 完成 排序 任务 。 

(3) 第 三 重 循环 是 从 第 一 个 记录 开始 ,以 某 个 d 值 为 间距 进行 组 内 比较 。 若 有 逆序 , 则 
进行 交换 。 
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算法 8.2 项 尔 排 序 算法 。 


void slpx(redtype r[], int n) 
{ 


int j; 

int k; 

redtype t; 

int d= n/2; // 置 初始 增 量 为 元 素 个 数 的 一 半 
while(d>=1) // 依 次 取出 各 增 量 


{ 
for(k=d;k<n;kt+) // 对 每 一 元 素 实施 插入 排序 ,将 其 分 别 插入 各 自 的 分 组 中 
{ 
t=r[k]; // 保 存 待 插入 记录 
j=k-d; // 待 插入 记录 所 属 分 组 的 前 一 记录 
while(j> = 0g&t. key < r[j].key) // 比 较 两 个 记录 的 大 小 
{ 
r[j+d]=r[j]; // 插 入 排序 , 较 大 的 前 一 记录 向 后 移动 


ji-=d; // 寻 找 本 分 组 的 前 一 记录 
} 
r[j+d]=t; // 插 入 一 个 记录 
} 
d/=2; // 增 量 减 半 


} 

希 尔 排 序 的 主要 特点 是 : 每 一 趟 以 不 同 的 增 量 进行 插入 排序 。 当 vd 较 大 时 ,被 移动 的 
记录 是 跳跃 式 进行 的 。 到 最 后 一 趟 排序 时 (d 二 1) ,许多 记录 已 经 有 序 ,不 需要 多 少 移动 ,所 
以 提高 了 排序 的 速度 。 一 般 来 说 , 希 尔 排序 比 直 接 插入 排序 要 快 ,平均 比较 次 数 和 记录 平均 
移动 次 数 均 为 nw 左右 。 希 尔 排 序 是 不 稳定 的 排序 方法 。 


6.3 交换 排序 


交换 排序 是 通过 两 两 比较 待 排序 记录 的 关键 值 ,交换 不 满足 顺序 的 那些 偶 对 ,直到 全 部 
满足 为 止 。 本 节 介 绍 两 种 交换 排序 方法 : 冒 泡 排序 和 快速 排序 。 


8.3.1 冒 泡 排序 


冒 泡 排 序 也 叫 起 泡 排序 气泡 排 序 等 。 冒 泡 排序 是 通过 相 邻 的 记录 两 两 比较 和 交换 ,使 
关键 字 较 小 的 记录 像 水 中 的 气泡 一 样 逐 趟 向 上 漂浮 ; 而 关键 字 较 大 的 记录 好 比 石 块 往 下 
沉 ,每 一 趟 有 一 块 “ 最 大 ”的 石头 沉 到 水 底 。 

冒 泡 排序 的 基本 思路 : 先 将 第 一 个 记录 的 关键 字 和 第 二 个 记录 的 关键 字 进 行 比较 , 若 
为 道 序 ( 即 >[1]. key 二 rL2]. key) , 则 交换 两 个 记录 ; 然后 比较 第 二 个 记录 和 第 三 个 记录 的 
关键 字 , 若 为 逆序 , 则 又 交换 两 个 记录 ; 如 此 下 去 ,直至 第 n 个 记录 和 第 一 1 个 记录 的 关键 
字 比 较 完 为 止 , 这 样 就 完成 了 第 一 直 骨 泡 排序 ,其 结果 是 关键 字 最 大 的 记录 被 安置 到 第 ? 
个 记录 的 位 置 。 接 着 进行 第 二 趟 骨 泡 排序 ,对 前 ”一 1 个 记录 进行 类 似 操作 ,其 结果 是 关键 
字 次 大 的 记录 被 安置 到 第 ”一 1 个 记录 的 位 置 。 对 含有 ? 个 记录 的 文件 最 多 需要 进行 
n 一 1 趟 冒 泡 排序 。 当 比较 过 程 中 根 列 为 有 序 时 , 则 退出 整个 排序 。 


例如 , 设 待 排 序 文件 的 记录 关键 字 为 {60,71,49,11,82,49,3,66) ,图 8.4 显示 了 冒 泡 排 


序 的 过 程 。 
初始 状态 60 71 49 11 82 4 3 66 
第 1 趟 60 49 1 7 4 3 6 2 
第 2 趟 49 11 60 4 3 6 7 8 
第 3 趟 11 49 4 3 6 6 7 8 
第 4 趟 Il 49 3 4 60 6 7 8 
第 5 趟 11 3 4 4 60 6 71 8 
第 6 直 3 11 49 4 6 6 7 8 
第 7 趟 3 11 49 4 60 6 7 8 
图 8.4 冒 泡 排序 示例 
算法 思路 : 


(1) 第 一 重 循 环 进行 n 一 1 趟 排序 , 设 标 志 k 初 值 为 0; 

(2) 第 二 重 循 环 是 在 进行 第 i 趟 排序 时 进行 n 一 i 次 两 两 比较 , 若 逆序 , 则 交换 并 使 人 
值 增加 , 找 出 该 赵 的 最 大 值 放 在 第 一 i 十 1 位 置 上 ,继续 进行 下 一 趟 排序 ,在 一 趟 排序 的 比 
较 过 程 中 , 若 序列 有 序 ,无 记录 交换 ,标志 A 为 0, 则 退出 整个 排序 循环 。 


算法 8.3 由 泡 排 序 算法 。 


void mppx(redtype r[ ], int n) 
int 1 jk 
redtype x; 
i=1; k=1; 
while ((i<n)gg(k>0)) 
{ 
k=0; 
for(j=1;j<=n- i;j++) 
if(r[j+1].key<r[j].key) 
{ 


二 


// 进 行 a-1 趟 排序 


// 在 进行 第 i 趟 排 序 时 进行 n-i 次 两 两 比较 
// 交 换 记录 


// 改 变 交 换 标志 


x=r[j]; rj]=r[j+1]; rj+1]=x; 


} 
} 
} 


由 上 述 算法 可 见 ,当初 始 序 列 中 记录 已 按 关键 字 次 序 排 好 序 , 则 只 需要 进行 一 趟 排序 ， 
在 排序 过 程 中 只 需要 进行 2 一 1 次 比较 ,记录 移动 次 数 为 0; 反之 , 若 初始 序列 中 记录 按 道 
序 排列 ,车 待 排序 的 序列 及 个 记录 , 则 最 多 进行 n 一 1 趟 排序 。 最 大 比较 次 数 为 


pe ;) n(n—1) 
ni)= 
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交换 记录 时 移动 记录 的 次 数 约 为 3n”/2 次 , 故 总 的 时 间 复 杂 度 为 O(n?)。 
冒 泡 排序 是 稳定 的 ,因为 关键 字 相 等 的 记录 不 会 相互 交换 。 


8.3.2 快速 排序 


快速 排序 是 对 冒 泡 排序 的 一 种 改进 。 骨 泡 排序 中 记录 的 比较 和 交换 是 在 相 邻 的 单元 中 
进行 ,记录 每 次 交换 只 能 上 移 或 下 移 一 个 单元 ,因而 总 的 比较 和 移动 次 数 较 多 。 快 速 排 序 
中 ,记录 的 比较 和 交换 是 从 两 端 向 中 间 进 行 ,关键 字 较 小 和 较 大 的 记录 一 次 就 能 换 到 前 面 或 
后 面 ,记录 每 次 移动 的 距离 较 远 ,所 以 可 以 减少 总 的 比较 和 移动 次 数 。 

快速 排序 的 基本 思路 是 : 在 待 排序 的 ”个 记录 中 任 选 一 个 记录 ,通常 取 第 一 个 记录 ,以 
该 记录 的 关键 字 值 为 基准 ,用 交换 的 方法 将 所 有 记录 分 成 两 部 分 ,使 所 有 关键 字 比 基准 小 的 
记录 均 排 在 基准 记录 之 前 ,所 有 关键 字 比 基准 大 的 记录 都 排 在 基准 记录 之 后 ,基准 记录 在 两 部 
分 中 间 , 其 位 置 为 该 基准 记录 的 最 终 位 置 , 它 不 再 参加 以 后 的 排序 ,这 就 完成 了 一 趟 排序 。 接 
着 对 所 划分 的 前 后 两 部 分 分 别 重复 上 面 的 操作 ,直到 每 部 分 内 只 有 一 个 记录 为 止 ,排序 结束 。 

实现 一 趟 排序 的 具体 方法 是 : 设 待 排序 记录 存 于 7[t],r[t 十 1],…,r[wj 中 ,设置 两 个 变 
量 i 和 j ,它们 的 初 值 分 别 是 + 和 mm, 第 一 个 记录 即 基 准 记录 r[4]j, 其 关键 字 值 为 r[4]. key。 排 
序 开始 时 , 先 从 j 所 指示 的 位 置 起 向 前 扫描 , 当 r[tj. key 之 ~[7]. key 时 ,交换 r [tj. key 和 
r[jj. key, 使 关键 字 值 比 基 准 记录 的 关键 字 值 小 的 记录 交换 到 前 面 ; 然后 从 i 所 指示 的 位 
置 起 向 后 扫描 ,直到 rr[tj. key 二 r[i]. key, 交 换 r[tj. key 和 wr[ij. key, 使 关键 字 值 比 基 准 
记录 的 关键 字 值 大 的 记录 交换 到 后 面 。 重 复 这 两 步 直 至 i 二 j 为 止 。 

例如 , 设 待 排 序 序列 为 (60,71,49,11,82,49,3,66) ,快速 排序 的 一 趟 排序 过 程 和 各 趟 排 
序 状态 如 图 8.5 和 图 8. 6 所 示 , 其 中 , 方 框 表示 基准 记录 , 方 括 号 括 起 来 的 表示 无 序 部 分 。 


6 71 49 11 82 4 3 66 二 
j 60<66, 不 交换 ,jj-1 
69] 7 49 11 82 49 3 66 60>3, 交换 , i=i+1 
i 7 
3 内 49 11 82 49 的 66 71>60, 交换 ,j=j-1 
3 [6 49 11 82 4 71 66 60>49. 交 换 ，i=i+1 
i j 
3 49 49 11 82 [6 71 66 49<60, 不 交换 ，ii+1 
i J 
3 49 4 1 82 [6 71 66 11<60. 不 交换 ，i=i+1 
i 了 
3 4 4 1 8 [60] 71 66 82>60, 交 换 ， 广 广 ! 
站 
3 49 49 11 lol s 7 66 i=j 
六 
1 趟 排序 结果 
B 4 4 11] [6 [82 71 6 sd 


图 8.5 一 趟 排序 过 程 


60 型 ， 攀 - 烛 82 49 3 66 初始 状态 


[3 49 49 11] 60 [82 71 66] 2 趟 排序 后 


3 [4 49 1 60 [66 71] 82 3 趟 排序 后 


3 [ll 49 49 60 66 [71] 82 4 趟 排序 后 


3 11 49 49 60 6 11 82 ”5 趟 排序 后 


图 8.6 各 趟 排序 状态 


算法 思路 : 

(1) 确定 第 一 个 记录 为 基准 记录 r[z]j, 先 从 j 所 指示 的 位 置 起 向 前 扫描 , 当 x[]. key 二 
7[jj. key 时 ,交换 r[t] 和 [站 ,使 关键 字 值 比 基准 记录 的 关键 字 值 小 的 记录 交换 到 前 面 ; 

(2) 从 i 所 指示 的 位 置 起 向 后 扫描 ,直到 xr[t]. key 二 r[i]. key, 交 换 r[t] 和 xr[ 让 ,使 关 
键 字 值 比 基 准 记录 的 关键 字 值 大 的 记录 交换 到 后 面 ; 

(3) 重复 (1) 和 (2) ,直至 ;一 ) 为 止 完 成 一 趟 排序 ; 

(4) 只 要 上 <uw ,重复 (1) 一 (3) ,分 别 对 基准 记录 两 边 的 部 分 进行 快速 排序 。 

算法 8.4 快速 排序 。 

// 关 尖 关 闫 尖 关 关 闫 尖 关 闪闪 关 闫 关 关 关 关 关 关 关 闫 闫 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 尖 关 关 关 关 关 

// 快 速 排序 的 区 域 划 分 算法 

// 在 区 间 low 和 high 之 间 进 行 一 次 划分 


/其 关 凌 潍 打 关 关 容 六 六 其 守 外 庆 关 半 其 关 站 拓 关 站 关 尖 基站 关 关 闫 凑 关 关 关 甘 关 关 闫 关 并 其 其 关 其 关 
int partition(redtype r[ ], int low, int high) 
{ 


int i= low; 
int j= high; 
int t=r[i]. key; //t 为 划分 的 基准 值 
// 寻 找 基准 点 的 位 置 
do { 
while(t<=r[j].key&&i<j) ”// 基 准点 与 右 半 区 的 元 素 逐 个 比较 大 小 
j= 
if(i<j) // 在 右 半 区 中 找到 一 个 比 基 准 点 小 的 记录 
{ 
r[i]=r[j]; // 将 基准 点 与 该 记录 交换 ,将 小 的 记录 放 到 左 半 区 中 
BE 


} 
while(r[i].key<=t&&i<j)  ”// 在 基准 点 的 左 半 区 中 搜索 比 它 大 的 记录 


4+ 
if(i<j) // 在 左 半 区 中 找到 一 个 比 基 准 点 大 的 记录 
{ 
r[j]=r[i]; // 将 基准 点 与 该 记录 交换 ,将 大 的 记录 放 到 右 半 区 中 
hi 
} 
}while(i<j); // 如 此 重复 ,直到 左右 半 区 相 接 


r[i].key=t; 
return i; 
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// 关 尖 闫 尖 尖 尖 闫 关 尖 尖 美 闫 关 尖 美 关 尖 尖 奖 关 尖 美光 尖 尖 闫 关 尖 闫 闫 关 尖 闫 关 关 尖 关 闫 关 尖 闫 关 关 


// 快 速 排序 算法 
ee 
void quicksort (redtype r[ ], int low, int high) 
{ 
int position; 
if(low< high) // 当 区 间 下 界 小 于 区 间 上 界 d 
{ 
position = partition(r, low, high); // 将 该 区 间 分 成 两 半 ,position 为 分 界 点 
quicksort(r, low, position— 1); // 对 左 半 区 进行 快速 排序 
quicksort(r, position+1,high);  // 对 右 半 区 快速 排序 


} 


通常 ,快速 排序 平均 时 间 复 杂 度 为 O(nlbn)。 其 最 坏 情 况 是 每 次 划分 选取 的 基准 记录 
都 是 当前 无 序 区 中 关键 字 最 小 (或 最 大 ) 的 记录 ,划分 的 结果 是 基准 记录 左边 的 无 序 子 区 为 
空 (或 右边 的 无 序 子 区 为 空 ) ,而 划分 所 得 的 另 一 个 非 空 的 无 序 子 区 中 记录 数目 仅仅 比划 分 
前 的 无 序 区 中 记录 个 数 减 少 一 个 。 因 此 ,快速 排序 必须 做 一 1 趟 ,每 一 趟 中 需 进行 2 一 1 
次 比较 , 则 总 的 比较 次 数 达到 最 大 值 


AN n(n—1) 和 
com = Dy Cn —1) On’) 
i=1 


最 坏 情 况 下 时 间 复 杂 度 为 O(n?) ,快速 排序 所 需 的 比较 次 数 反而 最 多 。 

在 最 好 情况 下 ,每 次 划分 所 取 的 基准 记录 都 是 当前 无 序 区 的 “中 值 * 记 录 , 划 分 的 结果 是 
基准 记录 的 左 、 右 两 个 无 序 子 区 的 长 度 大 致 相等 。 设 C(n) 表 示 对 长 度 为 的 文件 进行 快 
速 排序 所 需 的 比较 次 数 , 显 然 它 应 该 等 于 对 长 度 为 n 的 无 序 区 进行 划分 所 需 的 比较 次 数 
nn 一 1, 加 上 递归 地 对 划分 所 得 的 左右 两 个 无 序 子 区 (长 度 小 于 或 等 于 nn/2) 进 行 快速 排序 所 
需 的 比较 次 数 。 假 设 文件 长 度 2 一 2 ,那么 总 的 比较 次 数 为 

Cl(n) n+2C(n/2) 
nn 十 2[n/2 十 2C(n/2*:)]=2n 十 4C(n/2?) 
起 e000 
knt+2Cn/2) =nlbn +nC(l) 
=O(nlbn) 

注意 : 式 中 C(1) 为 一 常数 ,k= 二 lbn。 

快速 排序 是 目前 基于 比较 的 内 部 排序 方法 中 速度 最 快 的 ,快速 排序 也 因此 得 名 。 快 速 
排序 需要 一 个 栈 空间 来 实现 递归 。 若 每 次 划分 均 能 将 文件 均匀 分 割 为 两 部 分 , 则 栈 的 最 大 深 
度 为 [lbn | 十 1, 所 需 栈 空间 为 Odbn)。 最 坏 情 况 下 ,递归 深度 为 ,所 需 栈 空间 为 O(n)。 

快速 排序 法 不 稳定 ,如 {6,6,2) 排 序 结 果 为 {2,6 ,6)。 


@.4 选择 排序 


选择 排序 是 指 每 次 从 待 排序 的 记录 中 选 出 关键 字 值 最 小 (或 最 大 ) 的 记录 ,顺序 放 在 已 
排序 的 有 序 序 列 中 ,直到 全 部 排 完 为 止 。 选 择 排序 主要 包括 简单 选择 排序 和 堆 排 序 两 种 。 


8.4.1 简单 选择 排序 


对 待 排序 的 文件 进行 2 一 1 趟 扫描 ,第 ; 趟 扫描 选 出 剩 下 的 ”一 ;十 1 个 记录 中 关键 字 值 
最 小 的 记录 和 第 i 个 记录 互相 交换 。 第 一 次 待 排序 的 空间 为 ~[1] 一 r[z] ,经 过 选择 和 交换 
后 ,r[1] 中 存放 最 小 的 记录 ; 第 二 次 待 排序 的 区 间 为 ~[2] 一 ~[z], 经 过 选择 和 交换 后 ,~[2] 
中 存放 次 小 的 记录 ,以 此 类 推 ,最 后 ,形成 -[1…n 成 为 有 序 序列 。 

例如 ,对 序列 {60,71,49,11,82,49,3,66) 进 行 简单 选择 排序 ,示例 如 图 8. 7 所 示 , 方 括 
号 内 是 已 排 好 序 的 序列 。 


初始 状态 60 71 4 11 8 和 3 6 
第 1 趟 B] 71 49 11 82 4 60 66 
第 2 趟 B 11] 4 7 8 4 6 66 
第 3 趟 B 11 4] 7 8 4 60 6 
第 4 趟 B 11 4 和 8 7 60 6 
第 5 趟 B l1 49 4 60] 71 82 66 
第 6 趟 B l1 49 和 4 60 66] 82 71 
第 7 趟 B 1 4 4 6 6 7 82] 


图 8.7 直接 选择 排序 示例 


算法 思路 : 

(1) 查找 待 排 序 序 列 中 最 小 的 记录 ,并 将 它 和 该 区 间 第 一 个 记录 交换 ; 
(2) 重复 (1) 到 第 ”一 1 次 排序 后 结束 。 

算法 8.5 简单 选择 排序 算法 。 


void zjxz(redtype r[ ], int n) 
int i, j,k; 
redtype x; 
for(i=1;i<n;i+t+) // 进 行 第 i 趋 排序 , 共 n-1 赵 
{ 
k= i; 
for (j=i+1;j<=n;j+t+) // 在 待 排序 列 中 查找 关键 字 值 最 小 的 记录 
if(r[j].key<r[k].key) 
k=j; 
if(i!=k) 
{x=r[i];r[i]=r[k];r[k] =x;} // 将 关键 字 值 最 小 的 记录 r[k] 和 r[i] 交 换 


上 


简单 选择 排序 所 需要 的 总 的 比较 次 数 为 O(n*)。 当 初始 文件 是 有 序 时 ,最 小 移动 记录 
次 数 等 于 0; 而 当初 始 文 件 是 逆序 时 ,每 次 都 要 交换 记录 。 直 接 选 择 排序 是 不 稳定 的 ,例如 
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序列 (6,6,2} 的 排序 结果 是 {2,6.6)。 


8.4.2 堆 排 序 


堆 排序 是 简单 选择 排序 的 改进 。 用 直接 选择 排序 从 ?个 记录 中 选 出 关键 字 值 最 小 的 
记录 要 做 ”一 1 次 比较 ,然后 从 其 余 n 一 1 个 记录 中 选 出 最 小 者 要 做 nn 一 2 次 比较 。 显 然 , 相 
邻 两 趟 中 某 些 比较 是 重复 的 。 为 了 避免 重复 比较 ,可 以 采用 树 形 选择 排序 比较 。 其 做 法 是 : 
先 把 待 排序 的 n 个 记录 的 关键 字 值 两 两 相 比 ,取出 较 小 者 。 然 后 用 同样 方法 比较 每 对 中 的 
较 小 者 ,以 此 类 推 ,直至 找 出 最 小 值 。 这 一 排序 过 程 可 以 用 一 棵 树 来 表示 , 树 中 的 叶子 结 点 
代表 待 排 序 记 录 的 关键 字 值 。 上 面 一 层 分 支 结 点 是 叶子 结 点 两 两 比较 的 结果 。 以 此 类 推 ， 
树 根 表示 最 后 选择 出 来 的 最 小 关键 字 值 。 在 选择 次 小 关键 字 值 时 ,只 要 将 叶子 结 点 中 的 最 
小 关键 字 值 改 为 =, 重 新 进行 比较 ,只 需要 修改 从 树 根 到 刚 改 为 oo 的 叶子 结 点 的 这 一 条 路 径 
上 各 结 点 的 值 ,其 他 结 点 保持 不 变 。 

例如 序列 (60,71,49,11,82,49,3,66}) ,选择 最 小 和 次 小 关键 字 值 的 树 形 选择 排序 过 程 
如 图 8.8 所 示 。 


(b) 求 出 次 小 关键 字 11 
图 8.8 树 形 选择 排序 


树 形 选择 排序 总 的 比较 次 数 为 O(nlbn) ,与 直接 选择 排序 比较 ,减少 了 比较 次 数 ,但 需 
要 增加 额外 的 存储 空间 存放 中 间 比 较 结 果 和 排序 结果 。1964 年 威 洛 姆 斯 对 树 形 选 择 排序 
提出 了 改进 方法 ,使 得 总 的 比较 次 数 达到 树 形 选择 排序 的 水 平 , 同 时 只 需要 一 个 记录 大 小 的 
辅助 空间 。 这 种 方法 叫 堆 排序 。 

堆 的 定义 是 ,2 个 元 素 的 关键 字 序列 ,ks,…,k,, 当 且 仅 当 满 足 : 


Ai < kz; Ai 之 Ra 
或 (Ey 2 
Ai < koinl ki 之 Rat 


堆 可 以 借助 完全 二 叉 树 来 描述 。 完 全 二 又 树 的 每 个 结 点 对 应 于 一 个 关键 字 , 根 结 点 对 


应 于 关键 字 k;。 于 是 , 堆 在 完全 二 又 树 中 解释 为 : 完全 二 人 

叉 树 中 任 一 分 支 结 点 的 关键 字 都 不 大 于 (或 不 小 于 ) 其 左右 

孩子 的 值 ,所 以 堆 顶 元 素 ( 或 完全 二 又 树 的 根 )A; 必 为 序列 (5 (2) 
中 个 元 素 的 最 小 (最 大 ) 值 。 例 如 序列 {12,36,24,85,47， 

30) 是 一 个 堆 顶 元 素 取 最 小 值 的 堆 , 如 图 8.9 所 示 。 GD Go) 

堆 排序 的 基本 思路 : 对 一 组 待 排序 的 记录 序列 , 先 将 图 8.9 堆 顶 元 素 取 最 小 值 的 示例 
其 关键 字 按 堆 的 定义 排列 成 一 个 序列 ( 称 初 建 堆 ), 找 到 最 
小 (最 大 ) 关 键 字 ,将 其 取出 。 用 剩余 的 ”一 1 个 元 素 再 重建 堆 , 便 可 得 到 次 小 (次 大 ) 值 。 如 
此 反复 执行 ,直到 全 部 关键 字 排 好 序 为 止 。 

用 筛选 法 可 以 把 以 Ai; 为 根 的 子 树 调整 成 堆 。 在 考虑 将 以 为 根 的 子 树 调整 为 堆 时 ， 
以 skiys，… ok, 为 根 的 子 树 已 经 是 堆 。 所 以 这 里 如 果 有 ;三 k; 时 , 则 不 必 改 变 任何 结 
点 的 位 置 ,以 k; 为 根 的 子 树 就 已 经 是 堆 ; 否则 就 要 适当 调整 子 树 中 结 点 的 位 置 以 满足 堆 的 
定义 。 由 于 k; 的 左 、 右 子 树 都 已 经 是 堆 , 根 结 点 是 堆 中 最 小 的 结 点 ,所 以 调整 后 的 k; 值 必 
定 是 原来 的 ks; 和 As+i 中 的 较 小 者 。 设 &s; 较 小 ,将 k; 和 As 交换 位 置 , 这 样 调整 后 的 ;三 
kzi sk; 三 zit1， 并 且 上 i141 为 根 的 子 树 ,原来 已 经 是 堆 , 不 必 再 做 任何 调整 。 只 有 以 &w 为 根 
的 子 树 由 于 ks; 值 与 &; 交换 了 ,所 以 有 可 能 不 满足 堆 的 定义 ,但 &y 的 左右 子 树 已 经 是 堆 ， 
这 时 可 重复 上 述 过 程 ,将 以 k,; 为 根 的 子 树 调整 成 堆 。 如 此 一 层 一 层 递 推 下 去 ,最 多 可 能 一 
直 进 行 到 叶子 结 点 。 由 于 每 步 中 都 保证 将 子 树 中 最 小 的 结 点 交换 到 子 树 的 根部 ,所 以 这 个 
过 程 是 不 会 反馈 的 , 它 就 像 第 子 一 样 ,把 最 小 的 关键 字 值 一 层 层 地 选择 出 来 。 例 如 ,用 一 维 
数组 x 存放 的 序列 是 {7,12,3,15,5,2} ,进行 初 建 堆 的 过 程 如 图 8. 10 所 示 , 图 中 右边 为 一 维 
数组 + 的 变化 情况 ,左边 为 与 其 对 应 的 完全 二 叉 树 的 逻辑 结构 。 由 于 ==7,[n/2J]==3, 所 以 
从 As 一 11 开始 执行 。 

算法 8.6 筛选 算法 。 

AN 关 关 关 关 尖 关 关 凑 关 关 闪闪 六 闫 关 关 尖 闫 关 关 六 尖 关 关 关 尖 关 关 关 尖 闫 关 关 尖 闫 关 关 关 尖 关 关 关 关 关 

// 第 选 法 ,将 以 结 点 为 根 的 二 叉 树 (但 所 有 大 于 i 的 顶点 j,j 都 满足 堆 定 义 ), 调 整 成 一 个 大 根 堆 

// 调 整 范围 : 结 点 i~ 结 点 j 

// 关 尖 关 关 尖 闫 关 关 尖 闫 尖 关 关 闫 闫 关 尖 闫 尖 关 关 关 关 关 关 尖 闫 关 关 尖 闫 关 关 关 闫 关 关 关 尖 关 关 关 关 关 


void sift(redtype r[], int i, int j) 
| 


redtype temp; 
int p=2xi; //p 指向 二 的 左 孩 子 
int t; 
while(p<=j) // 如 果 霸 的 左 孩 子 存 在 , 则 调整 ,否则 ,i 是 叶子 ,不 调整 
{ 
t=p; //t 指 向 i 的 左 孩 子 
if(p<j) // 如 果 工 有 右 孩 子 
if(r[pl].key<r[p+1].key) 
t=p+1; //p 指向 键 值 较 大 的 孩子 
if(r[i].key<r[t].key)  // 如 果 根 i 的 键 值 比 孩子 小 
{ 
temp= [i]; 
r[i]=r[t]; 


r[t] = temp; 


数组 r 中 的 键 什 


员 6 


- 


5 
2|3[1s|s|2 


3>2, 角 下 3 


(7 1 2 3 和 和 


IN 局 7|12| 2 1065|5|3 
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12>5, 世 下 12 站 


DL 
u 
, 
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图 8.10 初 建 堆 过 程 
i=t; // 互 换 后 势必 影响 以 t 为 根 的 堆 的 性 质 , 所 以 对 以 t 为 根 的 堆 再 进行 调整 
p=2%1 
i // 将 根 与 较 大 的 孩子 互 换 
else break; // 如 果 根 i 的 键 值 比 两 个 孩子 都 大 , 则 是 大 根 堆 , 无 须 调整 


} 


设 个 待 排 序 的 记录 已 存在 于 7 数组 中 ,只 要 使 i 从 n/2 变 到 1, 反复 调用 sift(r,i， 
n) ,就 完成 了 建 堆 , 堆 顶 记 录 r[1] 的 值 最 小 ,然后 将 r[1] 和 wr[nj 互 换 。 此 时 以 r[2] 和 xr[3] 
记录 的 值 为 根 的 子 树 仍 为 堆 , 只 要 再 调用 一 次 sift(r ,1,n 一 1), 便 可 得 到 包含 一 1 个 值 的 
新 堆 , 如 此 反复 执行 2 一 1 次 , 便 完成 了 排序 过 程 .不 过 ,最 后 > 中 保存 的 记录 是 按 关键 字 值 
的 递减 次 序 排列 。 

图 8. 11 所 示 是 对 图 8. 10 的 已 初 建 的 堆 进行 排序 的 过 程 。 

算法 8.7 堆 排 序 算法 。 


// 关 尖 尖 关 关 尖 关 尖 关 尖 关 关 尖 关 尖 关 尖 尖 闫 关 闪 尖 关 关 关 尖 关 关 关 关 关 尖 关 关 关 关 关 关 关 关 关 关 关 关 


// 堆 排序 ,建立 大 根 堆 


// 关 关 关 关 关 关 关 关 关 尖 关 关 尖 关 尖 尖 尖 关 闫 关 尖 尖 关 关 关 尖 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 


数组 r 中 的 键 值 
1 2 3 4 5 6 


了 1 3 3 1 未 | .了 


重建 堆 
5 与 15 交 换 5 1 2 3 4 5 6 
2 


重建 堆 


(3) 下 2 
ao O 
Ooo © oo 


重建 堆 


9 
(5) OO 9 玉 失 (3) OO 15 | 12 


本 汉 叭 辐 攻 ， 
图 8.11 堆 排 序 示例 
void creatheap(redtype r[ ], int n) 
{ 
int k; 
for(k=n/2;k>=1;k-—) 
Sift(r, k,n); // 对 非 叶子 结 点 k, 利用 调整 算法 ,使 以 该 节点 k 为 根 的 树 变 成 大 根 堆 


// 调 整 区 间 :(k--p) 
} 


/类 关 关 关 关 关 关 关 尖 关 关 关 尖 关 关 关 尖 关 关 关 关 关 关 关 尖 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 关 
// 堆 排序 算法 

// 数 据 集合 1~n 的 数 进行 堆 排序 

// 数 据 元 素 r[0] 留 空 

// 可 作为 辅助 变量 ,实现 两 个 元 素 的 互 换 

// 兴 关 尖 尖 关 关 闫 闪闪 关 关 兴 尖 关 关 关 尖 关 尖 关 尖 关 尖 关 尖 关 关 尖 关 关 关 尖 关 尖 关 关 关 关 关 关 关 关 关 关 


void heapsort(redtype r[ ], int n) 
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{ 


int i; 
creatheap(r, n); // 将 上 中 的 n 个 元 素 创 建成 大 根 堆 
for(i=n;i>1;i--)  // 堆 排序 ,r[1] 中 始终 为 无 序 区 的 最 大 值 
{ 
r[0] =r[i]; // 将 根 (最 大 值 ) 换 到 无 序 区 的 末尾 
r[i]=r[1]; //r[0] 作 为 辅助 变量 
r[1] =r[0]; 


sift(r,1,i-1); ”// 调 整 无 序 区 中 的 数据 ,使 之 保持 大 根 堆 性 质 


} 


堆 排 序 法 对 于 记录 数 较 少 的 文件 来 说 ,其 优越 性 并 不 明显 ,但 对 记录 数 较 大 的 文件 还 是 
很 有 效 的 。 它 的 运行 时 间 主 要 耗费 在 建 初始 堆 和 调整 建新 堆 时 进行 的 反复 “筛选 * 上 。 堆 排 
序 只 需要 一 个 记录 大 小 的 辅助 空间 , 堆 排 序 算法 的 时 间 复 杂 度 为 O(nlbn)。 

堆 排 序 是 一 种 不 稳定 的 排序 方法 ,因为 堆 排 序 过 程 需要 进行 任意 位 置 上 记录 的 移动 和 
交换 ,如 {6,6,1}。 


6.5 归并 排序 


归并 排序 是 男 一 种 类 型 的 排序 方法 。“ 归 并 ”的 意思 是 把 两 个 或 多 个 有 序 表 进行 合并 ,得 
到 一 个 新 的 有 序 表 。 将 两 个 有 序 子 文件 合并 成 一 个 有 序 文件 , 称 为 二 路 归并 。 当 然 ,也 有 三 路 
归并 或 多 路 归并 等 。 其 中 ,二 路 归并 最 简单 ,是 其 他 归并 的 基础 ,本 节 只 讨论 二 路 归并 算法 。 

归并 的 思想 是 : 只 要 比较 各 个 有 序 表 的 第 一 个 记录 的 关键 字 值 , 找 出 最 小 的 一 个 作为 
排序 后 的 第 一 个 记录 的 值 ,取出 这 个 记录 存 入 排序 结果 表 中 。 继 续 比 较 各 个 有 序 表 的 第 一 
个 记录 的 值 , 找 出 最 小 的 ,作为 排序 后 的 第 二 个 记录 的 值 ,取出 这 个 记录 存 入 结果 表 中 。 以 
此 类 推进 行 依次 扫描 ,就 可 得 到 排序 结果 。 

假设 待 排 序 的 表 中 及 个 记录 , 则 可 看 成 是 nn 个子 表 , 每 个 子 表 中 只 含 一 个 记录 ,所 以 
是 有 序 的。 通常 将 首尾 相 接 的 两 个 子 表 进行 合并 ,得 到 n/2 个 较 大 的 有 序 子 表 , 每 个 子 表 
包含 两 个 记录 , 称 为 一 趟 归并 。 再 对 这 些 有 序 子 表 两 两 进行 合并 ,以 此 类 推 ,最 后 合并 成 一 
个 含有 nn 个 记录 的 有 序 表 为 止 , 排 序 完 成 。 其 中 每 步 合 并 都 采用 二 路 归并 ,这 种 排序 方法 
称 为 二 路 归并 排序 。 

例如 ,序列 {60,71,49,11,82,49.3.66) ,二 路 归并 排序 过 程 如 图 8. 12 所 示 。 开 始 归并 
时 , 先 把 这 8 个 记录 看 成 长 度 为 1 的 8 个 有 序 子 表 , 然 后 逐步 进行 归并 。 

初始 状态 。 [60] [1] [49] [1] [82] [49] B] [66] 


第 1 趟 归并 [60 71] [1 49] 中 82] [3 66] 


第 2 趟 归并 II 49 60 7] B 49 66 82] 


第 3 趟 归并 B 1 49 4 60 6 7 8] 


8.12 二 路 归并 排序 示例 


从 以 上 例子 中 可 以 看 出 ,合并 是 归并 排序 的 核心 ,即将 两 个 首尾 相连 的 有 序 子 表 合 并 成 
一 个 有 序 子 表 。 在 合并 的 基础 上 进行 一 趟 排序 ,在 一 趟 排序 的 基础 上 完成 多 趟 排序 。 

下 面 分 别 对 合并 、 一 趟 归并 、 多 趟 归并 进行 算法 描述 和 分 析 。 

合并 的 算法 思路 : 

(1) 设 数 组 x 中 第 一 个 有 序 子 表 从 第 low 个 记录 开始 至 第 m 个 记录 为 止 , 即 [low] 一 
r[Lmj, 第 二 个 有 序 子 表 从 第 十 1 个 记录 开始 到 第 high 个 记录 为 止 , 即 >[m 十 1] 一 
r[Lhighj, 最 后 形成 的 有 序 表 为 rLlow] 一 [highj]; 

(2) 设置 ij .p 分 别 指向 (1) 中 所 指 的 三 个 有 序 表 的 第 一 个 单元 ; 

(3) 比较 r[ 让 和 x[Lj] 的 关键 字 值 的 大 小 ,车 [ij]. key 委 ~[D7].key, 则 将 第 一 个 有 序 子 
表 的 记录 r[ 引 复制 到 数组 t+[p] 中 ,并 使 i、p 分 别 增 1; 

(4) 否则 ,将 第 二 个 有 序 子 表 的 记录 r[j 复制 到 zt[pj 中 ,并 使 j、p 分 别 增 1, 以 此 类 
推 , 直 到 全 部 记录 复制 到 [low] 一 [high] 中 。 

算法 8.8 ”两 个 有 序 子 表 合并 算法 。 

void merge(redtype z[], int low, int m, int high) 

int i= low,j=m+1,p=0; 

redtype *t; 
t= (redtype * )malloc(sizeof(redtype) * (high— low+1)) // 动 态 申请 辅助 存储 空间 
while(i< = m&&j<= high) // 合 并 

t[pt++] = r [i].key<r [j].key? r [i++]: r [j++]; 


while(i<=m) // 若 前 一 组 还 有 多 余数 据 ,全 部 复制 到 辅助 空间 
t[p++]= [i++]; 
while(j< = high) // 若 后 一 组 还 有 多 余数 据 ,全 部 复制 到 辅助 空间 


t[p++]= r [j++]; 
for(p=0,i= low;i<= high;i+t+,p++) 
r [i]=t[p]; // 从 辅助 空间 写 回 到 原 数 据 空间 
} 


一 趟 归并 的 思路 是 : 把 数组 ~ 中 的 长 度 为 length 的 相 邻 有 序 子 表 两 两 合并 ,归并 成 一 
个 长 度 为 2* length 的 有 序 子 表 。 

算法 8.9 长 度 为 length 的 所 有 相 邻 有 序 子 表 两 两 合并 ,归并 成 一 个 长 度 为 2* length 
的 有 序 子 表 。 


void mergepass(redtype r [], int n, int length) 
{ 
int i; 
for(i=0;i+2*x*length- 1<n;i+=2* length) 
// 在 + 的 某 个 区 间 上 进行 一 次 归并 排序 ,区 间 下 界 为 i 
// 上 界 为 i+2x* length- 1 两 个 子 序列 长 度 都 为 length, 上 下 界 分 界 点 为 i+ length 一 1 
merge(r,i,i+length-1,i+2*x length— 1); 
if(i+length- 1<n-1) // 最 后 一 次 合并 时 ,1<= 第 二 个 子 序列 长 度 < length 
mergel(r,i,i+length—1,n-1); 
} 


二 路 归并 排序 要 进行 多 趟 合并 ,其 思路 是 :第 一 趟 有 序 子 表 长 length 为 1, 以 后 每 趟 
length 加 倍 。 
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算法 8.10 二 路 归并 排序 算法 。 


void mergesort(redtype r [], int n) 
{ 
int length; 
for(length=1;length<n;lengthx =2)  // 进 行车 干 轮 次 的 归并 排序 ,n 个 数 ,归并 1b(n) 次 ， 
// 分 组 元 素 个 数 为 1,2,4,8,16, … ,2^length 
mergepass(r, n, length) ; 
} 
整个 归并 排序 的 效率 可 以 简单 分 析 。 对 于 归并 项 长 度 length 二 1,2,4,…,2m 一 1, 共 需 
m 次 调用 “一 趟 归并 算法 ”mergepass, 设 待 排 序 记 录 数 为 n, 则 mm 二 lb(n), 而 算法 mergepass 
的 运算 量 又 取决 于 “两 两 归并 算法 ”merge 的 运算 量 , 因此 ,归并 排序 的 总 的 渐进 时 间 复 杂 
度 为 OCzlb(z))。 执 行 归 并 排序 需要 的 附加 存储 空间 为 O(n) ,所 需 辅助 空间 较 大 。 二 路 
归并 排序 是 稳定 的 。 


[8.6 基数 排序 


基数 排序 与 前 面 所 述 的 各 种 排序 方法 完全 不 同 。 前 面 介绍 的 排序 方法 ,都 是 通过 关键 
字 之 间 的 比较 和 记录 的 移动 来 实现 的 ,基数 排序 不 需要 进行 记录 关键 字 间 的 比较 ,而 是 根据 
组 成 关键 字 的 各 位 值 , 即 借助 于 多 关键 字 排 序 的 思想 ,用 “分 配 ” 和 “收集 ”的 方法 进行 排序 。 

对 多 关键 字 排 序 的 理解 可 借助 下 面 的 例子 。 

每 一 张 扑 克 牌 有 两 个 关键 字 : 花色 和 面值 ,花色 的 地 位 高 于 面值 , 且 有 次 序 定义 如 下 。 

花色 : 梅花 二 方块 二 红心 二 黑 桃 

面值 : 2<3<4<=…<10<J<Q<K<A 

要 将 所 有 扑克 牌 按 以 上 次 序 排列 ,有 两 种 方法 。 

第 一 种 方法 是 先 按 花色 将 牌 分 成 四 堆 ,然后 将 每 堆 按 面值 从 小 到 大 排列 ,最 后 按 花色 从 
小 到 大 按 堆 相 释 , 从 而 得 到 要 求 的 结果 。 该 方法 称 为 “最 高 位 优先 法 ”, 简 称 MSD 法 。 

第 二 种 方法 是 先 按 面值 大 小 将 牌 分 成 13 堆 , 然 后 从 小 到 大 收集 起 来 ,再 按 花色 不 同 分 
成 四 堆 , 最 后 顺序 收集 起 来 就 是 排序 结果 。 该 方法 称 为 “最 低位 优先 法 ”, 简 称 LSD 法 。 

当 关键 字 值 由 多 个 项 组 成 时 ,常用 这 种 排序 方法 。 

对 于 及 n 个 记录 的 待 排序 序列 RR ,R,,…,R, ,其 第 i 个 记录 中 含有 d 个 关键 字 (K!， 
K?,…,K"), 则 称 这 d 个 关键 字 构 成 一 个 d 元 组 ,其 中 K' 称 为 关键 字 的 最 高 位 ,K” 称 为 
关键 字 的 最 低位 。 

下 面 说 明 两 个 d 元 组 相互 比较 大 小 的 概念 。 对 两 个 d 元 组 (zx ,zx*,…,z”) 和 (y'， 
yy ) 当 上 且 仅 当 zz! 二 y (1ij) 以 及 zx 过 yi! 时 ,d 元 组 (x! ,x?,…,x ) 小 于 d 元 
组 (y!',y?,…,y” ); 当 且 仅 当 zx’ 二 y'(1i<d) 时 ,d 元 组 (x ,x?,…,x") 等 于 d 元 组 (y'， 
y*，"…,y” )。 根 据 这 个 概念 , 当 且 仅 当 序列 的 每 两 个 记录 R;、R; 有 (K',K’?,…,K’)< 
(K!',K?,…,K") 时 , 称 记录 Ri1,R,,…,R, 是 按 关键 字 (K',K?,…,K") 排 序 的 , 即 基 数 
排序 。 

基数 排序 具体 的 方法 描述 如 下 。 


(1) 最 高 位 优先 : 先 对 最 高 位 关键 字 K' 进行 排序 ,将 序列 分 成 若干 子 序列 ,每 个 子 序 
列 中 的 记录 都 具有 相同 的 K' 值 ,然后 分 别 就 每 个 子 序 列 对 关键 字 开 ” 进行 排序 , 按 K? 值 
不 同 再 分 成 若干 更 小 的 子 序列 ,依次 重复 ,直至 对 K”， 进行 排序 之 后 得 到 的 每 一 子 序列 中 
的 记录 都 具有 相同 的 关键 字 。 然 后 每 个 子 序 列 分 别 对 K” 进行 排序 ,最 后 将 所 有 子 序列 依 
次 连接 在 一 起 成 为 一 个 有 序 序列 。 

(2) 最 低位 优先 法 : 从 最 低位 关键 字 K” 起 进行 排序 ,然后 再 对 高 一 位 的 关键 字 及” 
进行 排序 ,依次 重复 ,直至 对 K' 进行 排序 后 便 成 为 一 个 有 序 序列 。 

比较 MSD 法 和 LSD 法。 一 般 地 ,LSD 法 要 比 MSD 法 简单 ,因为 LSD 法 是 从 头 到 尾 
进行 若干 次 分 配 和 收集 ,执行 的 次 数 取决 于 构成 关键 字 值 的 成 分 为 多 少 ; 而 MSD 法 则 要 
处 理 各 序列 与 子 序列 的 独立 排序 问题 ,就 可 能 复杂 一 些 。 下 面 着 重 讨论 LSD 法 排序 的 
思想 。 

将 一 个 项 组 成 的 关键 字 值 分 拆 到 位 ,例如 ,将 267 分 拆 成 2,6,7, 每 位 的 可 能 取 值 个 数 
称 为 基数 , 记 为 j 。 各 位 关键 字 值 的 可 能 取 值 都 是 0~9, 共 有 10 个 数字 ,j 二 10, 关 键 字 值 的 
位 数 记 为 4d。 这 种 关键 字 为 十 进 制 的 排序 称 为 以 10 为 基 的 排序 。 如 果 关 键 字 采用 二 进 制 
表示 法 , 则 称 为 以 2 为 基 的 排序 。 一 般 地 ,可 以 任意 地 选择 基 r, 从 而 得 到 以 7 为 基 的 排序 。 
根据 最 低位 的 关键 值 ,将 所 有 键 值 分 配 到 j 个 队列 中 ,然后 按 最 低位 键 值 递增 的 次 序 将 j 个 
队列 中 的 键 值 收集 到 一 个 数组 中 ,再 对 键 值 的 高 一 位 做 同样 处 理 。 以 此 类 推 ,直到 最 高 位 处 
理 完毕 ,就 完成 了 整个 排序 。 排 序 需 做 d 趟 分 配 和 收集 。 为 避免 记录 的 大 量 移动 ,通常 用 
链 式 存储 结构 类 型 来 实现 基数 排序 。 结 点 类 型 定义 为 : 


#define M3 
typedef struct 
{ int key; 
float data; 
int next; 
}jsjd; 
数组 + 存放 待 排序 的 记录 ,数组 元 素 的 类 型 为 jsjd, 设 next 字段 存放 下 一 个 记录 的 下 
标 , 另 设 两 个 数组 f 和 e ,分 别 保存 7 个 队列 的 头 、 尾 指针 ,初始 状态 都 为 0。 执 行 基 数 排序 
将 记录 分 配 到 相应 的 队列 中 ,并 把 这 些 队列 中 的 记录 收集 起 来 ,只 需要 修改 next 和 相应 的 
队列 指针 即 可 ,从 而 使 记录 的 移动 系数 降 为 0。 假设 每 个 关键 字 值 为 小 于 1000 的 正 整 数 ， 
j 二 10,d 二 3。 算 法 结束 时 ,记录 仍 在 数组 x 中 ,函数 返回 值 为 排序 后 的 第 一 个 记录 的 位 罗 。 
算法 8. 11 基数 排序 法 。 


int jspx(jsjd r[ ],int n) 
{ 
int i,j,k,t,p,rd,rg,f[10],e[10]; 
for(i=1;i<n;it+) 
r[il].next=i+1; 
r[n].next=0; 
p=1;rd=1;rg= 10; 
for(i=1;i<=M;i+t+) 
{ 
for (j=0;j<10;j++) // 初 始 队列 置 空 
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{£[j] =0; e[j] =0;} 


while(p> 0) 
{ 


k= (r[p].key % rg)/rd; 


if(f[k] == 0) 
f[k] = p; 
else 


r[e[k]].next=p; 


elk]=p; 
p=r[p].next; 
} 
08 
while (f[j] == 0) 
证 
p=£[j]; 
t= e[j]; 


for(k=j+1;k<10;k++) 


if(f[k]> 0) 


// 将 记录 分 配 到 各 个 队列 中 


// 寻 找 第 一 个 非 空 队列 


// 收 集 各 个 队列 中 的 记录 


{r[t].next = f[k];t= elk];} 


r[t]. next = 0; 


rg=rg*10;rd= rdx 10; 


} 


return (p) 


} 


下 面 用 一 个 例子 说 明 算 法 8. 11 的 操作 情况 。 
设 有 在 [0..99] 范 围 内 的 14 个 数组 成 的 序列 : 


09,07,18,03,52,04,06,08,05,13,42,30,35,26 
将 关键 字 中 的 每 一 个 十 进 制 数字 都 看 成 一 个 关键 字 , 因 此 d 二 2.n 二 14, 这 14 个 数 的 存储 结 


构 为 线性 链表 : 


09 一 07 一 18 一 03 一 52 一 04 一 06 一 08 一 05 一 13 一 42 一 30 一 35 一 26 
第 1 趟 按 关 键 字 的 最 低位 将 关键 字 值 分 配 到 相应 队列 中 ,如 图 8. 13 所 示 。 其 中 队 尾 指 


针 为 E[ij, 队 头 指针 为 FLi](0<i<9)。 


FIO] 一 30 
FI1] 
FD2] 一 52 一 42 
FD3] 一 03 一 13 
F[4]—04 
F[5]—05—35 
FI@] 一 06 一 26 
FI7] 一 07 
F[8]—18—08 
F[9] —09 


图 8.13 第 1 趟 分 配 之 后 


站 
二 


站 四 站 书 症 间 
EEC 


第 1 趟 收集 之 后 的 结果 如 图 8. 14 所 示 。 
30 一 S$2 一 42 一 03 一 13 一 04 一 05 一 35 一 06 一 26 一 07 一 18 一 08 一 09 
图 8.14 第 1 趟 收集 之 后 


第 2 趟 按 关键 字 第 二 低位 将 关键 字 分 配 到 相应 队列 如 图 8. 15 所 示 。 


FI0] 一 03 一 04 一 05 一 06 一 07 一 08 一 09 0 
FI 一 13 一 18 Bl 
FD] 一 26 ED 
F[3]—30—35 EL3 
F[4] 一 和 2 E[4 
F[5]—52 ES 
F[6] E[6 
F[7] EI7 
F[8] El8 
F[9] E[9 


图 8.15 第 2 趟 分 配 之 后 
第 2 趟 收集 之 后 的 结果 如 图 8. 16 所 示 。 


03 一 04 一 05 一 06 一 07 一 08 一 09 一 13 一 18 一 26 一 30 一 35 一 42 一 52 
图 8.16 第 2 趟 收集 之 后 


经 过 两 趟 分 配 与 收集 之 后 完成 了 排序 。 

算法 效率 分 析 : 算法 jspx 对 数据 进行 了 cd 趟 扫 撒 ,每 趟 需 时 间 O(n 十 j )。 因 此 总 的 计 
算 时 间 为 O(Cd (n 十 j))。 对 于 不 同 的 基数 j 所 用 的 时 间 是 不 同 的 。 当 n 较 大 或 4 较 小 时 ， 
这 种 方法 较为 节省 时 间 。 另 外 ,基数 排序 适用 于 链 式 存储 结构 的 记录 的 排序 , 它 要 求 的 附加 
存储 量 是 j 个 队列 的 头 、 尾 指针 。 所 以 ,需要 O(n 十 j ) 辅 助 空间 。 基 数 排序 是 一 种 稳定 的 
排序 方法 。 

综合 本 章 的 各 种 内 部 排序 方法 ,它们 的 性 能 比较 如 表 8. 1 所 示 。 


表 8.1 各 种 内 部 排序 方法 的 性 能 比较 


方 法 平均 时 间 最 坏 情 况 辅助 存储 
简单 排序 O(n’) O(n’) O(1) 
快速 排序 Olnlbn) O(n’) O(nlbn) 
堆 排 序 Onlbn) Onlbn) O(1) 

归并 排序 Onlbn) Onlbn) On) 

基数 排序 Ol(d (nt))) Ol(d (ntj)) O(ntj) 


从 表 8. 1 可 以 得 到 如 下 几 个 结论 。 

(1) 从 平均 时 间 而 言 , 快 速 排序 最 佳 。 但 在 最 坏 情况 下 时 间 性 能 不 如 堆 排 序 和 归并 
排序 。 

(2) 从 算法 简单 性 看 ,由 于 直接 选择 排序 、 直 接 插 入 排序 和 冒 泡 排 序 的 算法 比较 简单 ， 
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将 其 认为 是 简单 算法 ,都 包含 在 表 8. 1 的 简单 排序 中 。 对 于 和 希 尔 排序 、 堆 排序 .快速 排序 和 
归并 排序 算法 ,其 算法 比较 复杂 ,认为 是 复杂 排序 。 

(3) 从 稳定 性 看 ,直接 插入 排序 、 冒 泡 排 序 和 归并 排序 是 稳定 的 ,而 希 尔 排序 、 直 接 选 择 
排序 ,快速 排序 和 堆 排序 是 不 稳定 排序 。 

(4) 从 待 排序 的 记录 数 的 大 小 看 ,n 较 小 时 , 宜 采 用 简单 排序 ,而 ” 较 大 时 宜 采 用 改 
进 排 序 。 

由 于 各 种 排序 方法 各 有 优 缺 点 ,所 以 在 不 同 的 情况 下 可 选择 不 同 的 方法 。 考 虑 的 因素 
有 待 排序 的 记录 个 数 nn、 记录 本 身 的 大 小 、 记 录 的 关键 字 值 分 布 情况 、 对 排序 稳定 性 的 要 求 、 
辅助 存储 空间 的 大 小 等 。 

综 上 所 述 , 可 以 从 以 下 几 个 方面 来 选择 排序 方法 。 

(1) 当 待 排序 记录 数 n 较 大 时 ,车 要 求 排序 稳定 , 则 采用 归并 排序 。 

(2) 当 待 排序 记录 数 n 较 大 ,关键 字 分 布 随 机 ,而 且 不 要 求 稳 定时 ,可 采用 快速 排序 。 

(3) 当 待 排序 记录 数 ” 较 大 ,关键 字 会 出 现 正 ` 逆 序 情形 ,可 采用 堆 排 序 ( 或 归并 
排序 ) 。 

(4) 当 待 排序 记录 数 ” 较 小 ,记录 已 接近 有 序 或 随机 分 布 , 又 要 求 排序 稳定 时 ,可 采用 
直接 插入 排序 。 

(5) 当 待 排序 记录 数 n 较 小 , 且 对 稳定 性 不 做 要 求 时 ,可 采用 直接 选择 排序 。 


( 8.7 外 部 排序 简介 


前 面 讨论 的 数据 结构 ,其 数据 及 有 关 的 信息 较 少 ,都 存储 在 内 存 中 ,排序 过 程 也 均 在 内 
存 中 进行 。 但 在 实际 问题 中 ,经 常会 遇 到 输入 文件 中 记录 的 数量 很 大 ,计算 机 的 内 存 不 能 容 
纳 的 问题 ,排序 过 程 必须 借助 外 存 才 能 完成 ,这 时 的 排序 就 称 为 外 部 排序 。 


8.7.1 外 存 信息 的 存 取 


通常 ,计算 机 有 两 种 存储 器 : 一 是 内 存储 器 ,简称 内 存 或 主 存 ; 另 一 个 是 外 存储 器 , 简 
称 外 存 或 辅 存 。 内 存 的 存 取 速度 快 且 能 随机 存 取 ,但 存储 容量 较 小 。 外 存 的 存储 容量 很 大 ， 
但 存 取 速度 较 慢 。 外 存 一 般 包括 磁带 和 磁盘 。 


1. 磁带 信息 的 存 取 


磁带 是 涂 上 一 层 磁 性 材料 的 窄带 ,磁带 卷 在 带 盘 上 , 带 盘 安装 在 磁带 驱动 器 的 转轴 上 。 
了 驱动 器 控制 磁带 盘 转 动 , 带 动 磁带 移动 .通过 读 / 写 磁头 进行 读 / 写 信息 的 操作 。 

磁带 不 是 连续 运转 的 , 它 可 以 随时 启动 和 停止 。 磁 带 从 停止 状态 启动 后 ,要 经 过 一 段 加 
速 时 间 才 能 达到 正常 的 读 写 速度 。 同 样 ,从 运行 状态 到 停止 ,也 要 有 一 段 减速 时 间 。 为 适应 
这 种 运行 状况 ,在 磁带 上 ,信息 要 分 块 存储 ,各 信息 块 之 间 要 留 有 空隙 。 块 的 大 小 由 操作 系 
统 按 磁带 的 具体 情况 确定 。 

磁带 是 一 种 典型 的 顺序 存 取 的 存储 设备 。 存 取信 息 的 时 间 取 决 于 读 写 头 所 处 位 置 与 所 
要 读 写 信 息 的 位 置 之 间 的 距离 ,距离 越 大 ,时 间 就 越 长 ,这 是 顺序 存 取 设 备 的 主要 缺点 。 它 


使 查找 和 修改 信息 都 不 方便 。 因 此 ,磁带 主要 用 于 处 理 很 少 变化 、 只 进行 顺序 存 取 的 大 量 
数据 。 


2. 磁盘 信息 的 存 取 


磁盘 是 一 种 直接 存 取 的 存储 设备 ,不 但 能 进行 顺序 存 取 ,而 且 能 进行 直接 存 取 , 其 存 取 
速度 比 磁带 快 得 多 。 磁 盘 分 为 软盘 和 硬盘 两 种 。 硬 盘 的 容量 比 软盘 大 得 多 , 存 取 速度 也 比 
软盘 快 。 

硬盘 是 硬 磁盘 的 简称 。 它 主要 由 磁盘 组 和 磁盘 驱动 器 组 成 。 一 个 磁盘 组 由 若干 个 盘 片 
组 成 ,常用 的 有 4 片 .6 片 8 片 .11 片 等 。 每 个 盘 片 有 上 、 下 两 个 面 。 磁盘 组 的 最 上 层 和 最 
下 层 的 两 个 外 表面 不 使 用 。 磁 盘 驱 动 器 由 主轴 和 读 写 头 组 成 。 每 个 盘面 配置 一 个 读 写 头 。 
读 写 时 盘面 高 速 旋转 , 当 载 有 信息 的 部 分 通过 读 写 头 时 , 便 可 进行 信息 的 读 写 。 

每 个 盘面 上 不 同 半径 的 圆周 组 成 不 同 的 磁道 。 各 个 盘面 上 半径 相等 的 磁道 总 称 为 一 个 
柱 面 。 在 一 个 磁道 内 又 可 分 成 若干 个 扇 区 。 

磁盘 存 取信 息 时 ,首先 要 确定 信息 所 在 的 柱 面 ,再 将 磁头 移动 到 所 需 磁 道 的 位 置 上 ( 移 
动 磁头 所 需 的 时 间 称 为 磁头 定位 时 间或 称 为 寻 道 时 间 ) ,然后 等 待 磁道 上 的 信息 所 在 位 置 随 
着 磁盘 的 转动 而 转 到 磁头 下 面 (这 段 时 间 称 为 等 待 时 间 )。 由 于 磁盘 高 速 (5400 一 10 000r/m) 
运转 ,所 以 ,等 待 时 间 是 极 短 的 。 磁 盘 的 存 取 时 间 主 要 花 在 磁头 定位 时 间 上 。 


8.7.2 外 部 排序 的 基本 方法 


最 常用 的 外 部 排序 方法 是 归并 排序 法 。 这 种 方法 由 两 个 阶段 组 成 : 第 一 阶段 是 把 磁盘 
文件 逐 段 读 和 到 内 存 , 用 较 好 的 内 部 排序 方法 对 这 段 文件 进行 排序 。 已 排序 的 文件 段 通常 
称 为 归并 段 。 整 个 文件 经 过 逐 段 排序 后 再 逐 段 写 回 到 外 存 上 。 这 样 , 在 外 存 上 就 形成 了 许 
多 初始 归并 段 。 第 二 阶段 是 对 这 些 初 始 归并 段 使 用 某 种 归并 方法 (如 二 路 归并 法 ) ,进行 多 
遍 归 并 ,使 归并 段 的 长 度 由 小 变 大 ,最 后 在 外 存 上 形成 一 个 有 序 的 文件 。 

一 般 可 依据 所 使 用 的 外 存 设备 将 外 部 排序 分 为 磁盘 排序 和 磁带 排序 。 磁 盘 排序 和 磁带 
排序 基本 相似 ,区 别 在 于 初始 归并 段 在 外 存储 介质 中 的 分 布 方式 不 同 。 磁 盘 是 直接 存 取 设 
备 ,而 磁带 是 顺序 存储 设备 , 读 取信 息 块 的 时 间 与 所 读 信息 块 的 位 置 关 系 极 大 。 故 在 磁带 上 
进行 文件 排序 时 ,研究 归并 段 信息 块 的 分 布 是 个 极为 重要 的 问题 。 

最 简单 的 归并 排序 方法 与 内 排序 中 的 二 路 归并 类 似 。 假 设 一 个 具有 个 记录 的 文件 ， 
先 把 该 文件 看 作 是 由 n 个 长 度 为 1 的 有 序 串 组 成 ,然后 在 此 基础 上 进行 两 两 归并 。 经 过 
lbn 趟 归并 后 , 当 文 件 中 只 含有 一 个 长 度 为 n 的 有 序 串 时 ,整个 文件 的 排序 就 完成 了 。 在 每 
一 趟 排序 过 程 中 都 需要 进行 记录 的 内 外 存 交 换 。 

还 有 一 种 常用 的 外 部 排序 方法 是 多 路 归并 排序 。 由 于 在 外 部 排序 过 程 中 ,数据 的 内 外 
存 交 换 所 需 的 时 间 比 记录 的 内 部 归并 所 需 的 时 间 多 得 多 .所 以 可 以 通过 减少 数据 内 外 存 交 
换 的 次 数 来 提高 外 部 排序 的 效率 。 为 了 不 增加 内 部 归并 时 所 需 进行 关键 字 比 较 的 次 数 ,在 
具体 实现 时 通常 不 用 选择 排序 的 方法 .而 用 “ 败 者 树 " 来 实现 。 

关于 外 部 排序 的 有 关 问 题 ,读者 参阅 有 关 资 料 。 
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6.8 C++ 中 的 排序 


排序 是 对 数据 元 素 序列 建立 某 种 有 序 排列 的 过 程 , 即 把 数据 元 素 序列 整理 成 按 关 键 字 
递增 (或 递减 ) 排 序 的 过 程 。 几 种 典型 排序 方法 的 C++ 程 序 如 例 8. 1 一 例 8.4 所 示 。 


例 8.1 简单 选择 排序 的 C++ 程序 。 


template < class T> 
void SelectSort(T A[], int n) 


{ 
int small; 
for (int i=0; i<n-1; i++){ 
small = i; 


for (int j=i+1;j<n;j++) 
if (A[j]<A[small]) small = j; 


// 执 行 n-1 趟 
// 先 假定 待 排序 序列 中 第 一 个 元 素 为 最 小 
// 每 趟 扫描 待 排序 序列 np- il 次 


// 如 果 扫 描 到 一 个 比 最 小 值 元 素 还 小 的 , 则 记 下 其 下 标 


Swap(RA[i],RA[small]); 
} 
上 


例 8.2 快速 排序 的 C++ 程序 。 


template < class T> 
void QuickSort(T A[], int n) 
{ 
QSort(A,0,n—1); 
上 
template < class T> 
void QSort(T A[], int left, int right) 
//left 和 right 为 待 排序 序列 的 下 界 和 上 界 
{ 
ab 各 起 
if (left <right){ 
i= left; j=right+1; 
dof 
do i++;while (A[i]< A[left]); 
do j-- ; while (A[j]> A[left]); 
if (i<j) Swap(A[i],A[j]); 
}while (i<j); 
Swap(A[ left], A[j]); 
QSort(A, left,j— 1); 
QSort(A,j+1,right); 
} 
} 
例 8.3 二 路 归并 的 C++ 程序 。 


template < class T> 


// 最 小 元 素 与 待 排序 序列 中 第 一 个 元 素 交 换 


// 以 初始 序列 为 待 排序 序列 开始 快速 排序 


// 若 待 排序 序列 多 于 一 个 元 素 , 则 继续 快速 排序 
// 确 定 待 排序 序列 的 游 动 指针 i,j 

// 开 始 一 趟 快速 排序 , A[ left] 作 为 分 割 元 素 
/让 指针 从 左 往 右 找 第 一 个 三 分 割 元 素 的 元 素 
// 指针 从 右 往 左 找 第 一 个 三 分 割 元 素 的 元 素 
// 车 i<j, 则 交换 两 个 元 素 

// 若 i<j, 则 继续 本 趟 排序 

// 交 换 分 割 元 素 A[1left] 和 A[j] 的 位 置 

// 对 低 端 序列 快速 排序 

// 对 高 端 序列 快速 排序 


void Merge(T A[ ], int il, int j1, int i2, int j2) 
{ // 计 ,和 1 是 子 序列 1 的 下 、 上 界 ,i,j2 是 子 序 列 2 的 下 、 上 界 


T x Temp = new T[j2— il+1]; // 分 配 能 存放 两 个 子 序列 的 临时 数组 
int i= i1,j= i2,k=0; //i,j 是 两 个 子 序列 的 游 动 指 针 ,k 是 Temp 的 游 动 指针 
while (i<= jl&&j <= j2) // 若 两 个 子 序 列 都 不 空 , 则 循环 


if (A[i]<=A[j]) Temp[k++]=A[i++]; ”// 将 A[i] 和 A[j] 中 较 小 的 存 人 人 Temp[k] 
else Temp[ k++] =A[j++]; 
while (i<=j1) Temp[k++] = A[it+]; // 若 第 一 个 子 序列 中 还 有 剩余 的 就 存 人 Temp 
while (j<= j2) Temp[k++] = A[j++]; // 若 第 二 个 子 序列 中 还 有 剩余 的 就 存 人 Temp 
for (i=0; i<k; it+) A[il++] =Temp[i]; ”// 将 临时 数组 中 的 元 素 倒 回 A 
delete [ ] Temp; 
} 


例 8.4 归并 排序 的 C++ 程序 。 


template < class T> 
void MergeSort(T R[ ]，int n) 
{ 


int i1,j1, i2, j2; //il,j1 是 子 序列 1 的 下 、 上 界 , i2,j2 是 子 序列 2 的 下 .上 界 
int size= 1; // 子 序列 中 元 素 个 数 ,初始 化 为 1 
while (size<n){ 
il=0; 
while (il + size<n){ // 车 i1+ size<n, 则 说 明 存在 两 个 子 序列 , 需 再 两 两 合并 
i2= il+ size; // 确 定子 序列 2 的 下 界 
j1=i2-1; // 确 定子 序列 1 的 上 界 


if (i2+ size-1>n-1) 
j2=n-1; // 若 第 2 个 子 序列 中 不 足 size 个 元 素 , 则 置 子 序列 2 的 上 界 j2=n-1 
else j2=i2+size-1; // 和 否则 有 size 个 , 置 j2=i2+size-1 
Merge(A,il, jl, i2,j2); // 合 并 相 邻 两 个 子 序列 
il=j2+1; // 确 定 下 一 次 合并 第 一 个 子 序列 的 下 界 
} 
size* =2; // 元 素 个 数 扩 大 一 倍 


句 题 8 


1. 编写 一 种 快速 排序 的 非 递归 算法 。 要 求 : 复杂 度 不 得 超过 O(lbz ) 。 

2. 修改 冒 泡 排序 ,以 交换 的 正 反 两 个 方向 进行 扫描 , 即 第 1 趟 把 键 值 最 大 的 记录 放 在 
末尾 ,第 2 趟 把 键 值 最 小 的 记录 放 在 开头 ,以 此 类 推 ,反复 进行 。 

3. 对 于 给 定 的 一 组 关键 字 : 

{49,38,65,97,76,13,27,38,9,16} 

分 别 写 出 直接 插入 排序 、 希 尔 排 序 、 冒 泡 排 序 、 快 速 排序 、 直 接 选 择 排序 、 堆 排序 (大 根 堆 )、 二 
路 归并 排序 对 该 序列 做 升序 排列 的 各 趟 结果 。 

4. 一 个 线性 表 元 素 由 正 整 数 和 负 整 数组 成 ,利用 一 趟 快速 排序 方法 编写 算法 ,把 正 整 
数 和 负 整数 分 开 ,使 线性 表 的 前 一 半 为 负 整 数 ,后 一 半 为 正 整数 。 

5. 以 单 链表 为 存储 结构 实现 直接 选择 排序 , 试 写 出 它 的 算法 。 
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6. 判别 以 下 序列 是 否 为 堆 ? 如 果 不 是 , 则 把 它 调整 为 堆 : 

(1) (100,86,48,73,35,39,42,57,66,21); 

(2) (12,70,33,65,24,56,48,92,86,33); 

(3) (103,97,56,38,66,23,42,12,30,52,06,20); 

(4) (05,56,20,23,40,38,29,61,35,76,28,100)。 

7. 有 nn 个 不 同 的 英文 单词 ,它们 的 长 度 相等 , 均 为 m。 若 n 全 50,m 二 5, 采用 什么 排序 
方法 时 间 复 杂 度 最 佳 ? 为 什么 ? 

8. 试 构造 一 种 排序 方法 ,使 五 个 整数 至 多 用 七 次 比较 就 完成 排序 任务 。 

9. 给 出 一 组 关键 字 T=12,2,16,30,8,28,4,10,20,6,18, 写 出 用 下 列 排序 方法 对 工 
进行 排序 过 程 中 所 出 现 的 状态 : 

(1) 插入 排序 

(2) 希 尔 排序 ; 

(3) 归并 排序 ; 

(4) 快速 排序 ; 

(5) 基数 排序 。 

10. 在 什么 条 件 下 MSD 法 比 LSD 法 更 有 效 ? 

11. 什么 是 外 部 排序 ? 磁带 文件 和 磁盘 文件 排序 的 主要 差别 是 什么 ? 


仁 机 练习 8 


1. 实现 升序 排序 的 下 述 算法 ,并 用 以 下 无 序 序列 加 以 验证 ， 
49,38,65,97,76,13,27,49 

(1) 简单 插入 排序 ; 

(2) 快速 排序 ; 

(3) 堆 排 序 ( 小 根 堆 ); 

(4) 直接 选择 排序 ; 

(5) 二 路 归并 排序 。 

2. 在 及 n 个 学 生 的 成 绩 表 里 ,每 条 信息 由 姓名 与 分 数组 成 。 要求: 

(1) 按 分 数 高 低 次 序 ,输出 每 个 学 生 的 名 次 ,分 数 相同 的 为 同一 名 次 。 

(2) 按 名 次 输出 每 个 学 生 的 姓名 与 分 数 。 


常用 算法 设计 技术 | 


本 章 学 习 要 点 

(1) 掌握 蛮 力 算法 、 分 治 算法 动态 规划 算法 、 贪 心算 法 、 回 溯 算法 和 分 枝 限 界 算法 等 的 
基本 思想 、 设 计 方 法 。 

(2) 能 根据 讲 力 算法 、 分 治 算法 ,动态 规划 算法 、 贪 心算 法 .回溯 算法 和 分 枝 限 界 算 法 等 
的 应 用 场合 选择 合适 的 算法 进行 设计 。 

算法 设计 技术 主要 应 用 于 计算 机 科学 中 的 经 典 问题 ,但 也 可 以 看 成 问题 求解 的 一 般 性 
工具 , 它 的 应 用 不 仅 限于 传统 的 计算 问题 和 数学 问题 ,也 告诉 人 们 如 何 应 用 一 些 特定 的 策略 
来 解决 问题 ,从 而 提高 解决 问题 的 能 力 。 


6.1， 查 力 算法 
A 
蛮 力 算法 是 一 种 最 简单 的 设计 策略 ,也 是 最 容易 应 用 的 方法 。 


9.1.1 蛮 力 算法 思想 


蛮 力 算法 是 一 种 简单 直接 地 解决 问题 的 方法 ,常常 直接 基于 问题 的 描述 和 所 涉及 的 概 
念 进行 定 义 。 也 可 以 用 “直接 做 吧 ” 来 描述 蛮 力 算法 这 种 设计 策略 。 作 为 一 个 例子 ,请 考虑 
一 个 指数 问题 :对 于 给 定 的 数字 a 和 一 个 非 负 整数 ,计算 a" 的 值 。 根 据 指数 的 定义 ， 

n 次 

a” 二 a XaX…Xa, 我 们 可 以 简单 地 把 1 和 a 相 乘 次 ,来 得 到 a” 的 值 。 

虽然 巧妙 和 高 效 的 算法 很 少 来 自 于 蛮 力 算法 ,但 它 仍 是 一 种 重要 的 算法 设计 策略 ,其 特 
点 有 : 

(1) 适用 范围 广 , 它 可 能 是 唯一 一 种 几乎 什么 问题 都 能 解决 的 一 般 性 方法 ; 

(2) 常用 于 一 些 非 常 基本 但 又 十 分 重要 的 算法 (排序 .查找 .矩阵 乘法 和 字符 串 匹 配 
等 ) ,并 不 限制 实例 的 规模 ; 

(3) 解决 一 些 规模 小 或 能 够 接受 的 速度 对 实例 求解 的 问题 ; 

(4) 可 以 作为 同样 问题 的 更 高 效 算法 的 一 个 标准 ; 

(5) 可 以 通过 对 蛮 力 算法 的 改进 来 得 到 更 好 的 算法 。 

蛮 力 算法 确实 简单 实用 ,可 是 效率 却 比 较 低 。 
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9.1.2 迹 力 算法 应 用 实例 一 一 最 近 对 问题 


最 近 对 问题 要 求 找 出 一 个 包含 ”个 点 的 集合 中 距离 最 近 的 两 个 点 。 为 了 简单 起 见 , 只 
在 二 维 的 情况 下 考虑 该 问题 。 假 设 所 讨论 的 点 是 以 标准 的 笛 卡 儿 坐 标 形式 即 (z,y) 给 出 
的 ,因此 在 两 个 点 P; 二 (x;,y;) ,Pj 二 (xj,y;) 之 间 的 距离 是 标准 的 欧 几 里 得 距离 。 

求解 最 近 对 问题 的 蛮 力 算法 应 该 是 这 样 : 分 别 计算 每 一 对 点 之 间 的 距离 . 然后 找 出 距 
离 最 小 的 那 一 对 。 当 然 ,我们 不 希望 对 同一 对 点 计算 两 次 距离 。 为 了 避免 这 种 状况 ,我 们 只 
考虑 i<j 的 那些 对 (P; ,P;)。 

算法 9.1 最 近 对 问题 的 蛮 力 算法 。 


# define Max max //max 为 计算 机 允许 的 最 大 值 
int ClosestPoints(int n, int x[ ], int y[ ], int * indexl，int * index2) 
//n 为 点 数 ,x、y 是 每 个 点 的 坐标 , indexl 和 index2 是 最 近 对 的 点 下 标 ,其 距离 为 函数 返回 值 
{ 
minDist = Max; 
for (i=1; i<n; i++) 
for (j=i+1; j<=n; j++) 
{ 
d= (x[i]—x[j])* (x[i]—x[j])+(y[i] = y[j])* (y[i] = y[j]); 
if (d<minDist) { 
minDist = d; 
x* indexl = i; 
* index2 = j; 
} 
} 
return minDist; 


} 


算法 的 基本 操作 是 计算 两 个 点 的 欧 几 里 得 距离 。 在 求 欧 几 里 得 距离 时 ,要 避免 求 平方 
根 操作 ,因为 求 平方 根 时 要 浪费 时 间 , 而 在 求解 此 问题 时 ,求解 平方 根 并 没什么 更 大 的 意义 。 
如 果 被 开 方 的 数 越 小 , 则 它 的 平方 根 也 越 小 。 因 此 ,算法 的 基本 操作 就 是 求 平方 即 可 ,其 执 
行 次 数 为 


拥 一 全 nn nl 
TQ0)=2) 2 2=22) mi)=n(n—1)=0(n’) 
i=1 


@.2 分 治 算法 


用 计算 机 求解 问题 所 需 的 计算 时 间 都 与 其 规模 有 关 , 问 题 的 规模 越 小 , 解 题 所 需 的 计算 
时 间 也 越 短 , 从 而 也 较 容易 处 理 , 由 此 产生 分 而 治之 的 分 治 设计 技术 。 


9.2.1 分 治 算法 思想 


所 谓 分 治 算法 ,就 是 将 一 个 难以 直接 解决 的 大 问题 ,分 割 成 一 些 规模 较 小 的 相同 问题 ， 
以 便 各 个 击破 ,分 而 治之 。 更 一 般 地 说 ,将 要 求解 的 原 问题 划分 成 & 个 较 小 规模 的 子 问题 ， 
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对 这 个子 问 题 分 别 求解 。 如 果子 问题 的 规模 仍然 不 够 小 , 则 再 将 每 个 子 问 题 划 分 为 个 
规模 更 小 的 子 问 题 , 如 此 分 解 下 去 ,直到 问题 规模 足够 小 ,很 容易 求 出 其 解 为 止 , 青 将 子 问 题 
的 解 合 并 为 一 个 更 大 规模 的 问题 的 解 , 自 底 向 上 逐步 求 出 原 问题 的 解 。 

分 治 算法 规则 如 下 。 

(1) 平衡 子 问 题 : 最 好 使 子 问题 的 规模 大 致 相同 。 也 就 是 将 一 个 问题 划分 成 大 小 相等 
的 & 个子 问题 (通常 k= 二 2) ,这 种 使 子 问题 规模 大 致 相等 的 做 法 是 出 自 一 种 平衡 (balancing) 
子 问题 的 思想 , 它 几 乎 总 是 比 子 问题 规模 不 等 的 做 法 要 好 。 

(2) 独立 子 问 题 : 各 子 问题 之 间 相 互 独立 ,这 涉及 分 治 算法 的 效率 ,如 果 各 子 问 题 不 是 
独立 的 , 则 分 治 算法 需要 重复 地 解 公 共 的 子 问 题 。 

分 治 算法 的 典型 情况 如 图 9. 1 所 示 。 


原 问 题 的 规模 是 n 


子 问题 1 的 规模 是 /2 子 问题 2 的 规模 是 mx/2 


子 问题 1 的 解 子 问题 2 的 解 

| 
原 问 题 的 解 
图 9.1 分 治 算法 的 典型 情况 


9.2.2 分 治 算法 设计 


分 治 算法 在 求解 问题 时 效率 比较 高 ,也 是 一 种 重要 的 算法 策略 ,其 适用 条 件 如 下 : 

(1) 该 问题 的 规模 缩小 到 一 定 的 程度 就 可 以 容易 地 解决 ; 

(2) 该 问题 可 以 分 解 为 若干 个 规模 较 小 的 相同 问题 , 即 该 问题 具有 最 优 子 结构 性 质 ; 

(3) 利用 该 问题 分 解 出 的 子 问题 的 解 可 以 合并 为 该 问题 的 解 ; 

(4) 该 问题 所 分 解 出 的 各 个 子 问题 是 相互 独立 的 , 即 子 问 题 之 间 不 包含 公共 的 子 问题 。 

一 般 来 说 ,分 治 算法 的 求解 过 程 由 以 下 三 个 阶段 组 成 。 

(1) 划分 : 既然 是 分 治 , 当 然 需要 把 规模 为 ”的 原 问题 划分 为 & 个 规模 较 小 的 子 问题 ， 
并 尽量 使 这 个 子 问题 的 规模 大 致 相同 。 

(2) 求解 子 问题 : 各 子 问题 的 解法 与 原 问题 的 解法 通常 是 相同 的 ,可 以 用 递归 的 方法 
求解 各 个 子 问题 ,有 时 递归 处 理 也 可 以 用 循环 来 实现 。 

(3) 合并 : 把 各 个 子 问题 的 解 合并 起 来 ,合并 的 代价 因 情 况 不 同 有 很 大 差异 ,分 治 算法 
的 有 效 性 很 大 程度 上 依赖 于 合并 的 实现 。 

分 治 算法 的 一 般 过 程 : 


DivideConquer(P) 
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{ 


if(P 的 规模 足够 小 ) 直 接 求解 P; 
否则 : 
分 解 为 k 个 子 问题 P1,P2, … ,Pk; 
for(i=1;i<=k;it+) // 分 别 求解 
yi= DivideConquer(Pi); 
return Merge( yl, … , yk); // 合 并 子 问题 得 到 原 问 题 的 解 


} 


例 9.1 计算 指数 a" ,应 用 分 治 算法 得 到 计算 方法 如 式 (9.1) 所 示 , 计 算 过 程 如 图 9. 2 
所 示 。 


a 7 一] 
Q&"” 一 《9 1 
a xal"sl n>1 


分 解 问题 


| 求解 每 个 子 问题 


合并 子 问 题 的 解 


图 9.2 分 治 算法 计算 a" 的 过 程 


指数 a” 的 计算 问题 满足 分 治 算法 的 4 个 适用 条 件 。 由 式 (9.1) 所 示 , 当 问题 规模 小 到 
1(n 二 1) 时 就 直接 等 于 a ,可 以 容易 地 解决 ; 指数 a” 的 计算 问题 分 解 为 2 个 规模 较 小 (规模 
都 为 n/2) 的 相同 问题 , 原 问题 的 解 包含 子 问题 的 解 , 即 该 问题 具有 最 优 子 结构 性 质 ; 利用 子 
问题 的 解 相 乘 就 得 到 原 问 题 的 解 , 即 子 问 题 可 以 合并 为 该 问题 的 解 ; 该 问题 所 分 解 出 的 各 个 
子 问题 是 相互 独立 的 , 即 子 问题 之 间 不 包含 公共 的 子 问题 ,一 个 子 问 题 不 会 被 计算 多 次 。 


9.2.3 分 治 算法 设计 应 用 实例 一 一 棋盘 覆盖 问题 


在 一 个 2* X2* 个 方 格 组 成 的 棋盘 中 , 恰 有 一 个 方 格 与 其 他 方 格 不 同 , 称 该 方 格 为 一 特 
殊 方 格 , 且 称 该 棋盘 为 一 特殊 棋盘 ,如 图 9.3(a) 所 示 。 在 棋盘 覆盖 问题 中 ,要 用 图 9.3(b) 所 
示 的 4 种 不 同形 态 的 L 形 骨牌 覆盖 给 定 的 特殊 棋盘 上 除 特殊 方 格 以 外 的 所 有 方 格 , 且 任何 
2 个 世 形 骨牌 不 得 重 琶 覆盖 。 

分 析 : 当 A>0 时 ,将 2 X2* 棋盘 分 割 为 4 个 2 !X2*"! 子 棋盘 ,如 图 9.4(a) 所 示 。 

特殊 方 格 必 位 于 4 个 较 小 子 棋盘 之 一 中 ,其 余 3 个 子 棋盘 中 无 特殊 方 格 。 为 了 将 这 
3 个 无 特殊 方 格 的 子 棋盘 转化 为 特殊 棋盘 ,使 之 与 原 问题 相同 ,可 以 用 一 个 世 形 骨牌 覆盖 这 
3 个 较 小 棋盘 的 会 合 处 ,如 图 9. 4(b) 所 示 ,从 而 将 原 问题 转化 为 4 个 较 小 规模 的 棋盘 覆盖 问 
题 。 递 归 地 使 用 这 种 分 割 ,直至 棋盘 简化 为 棋盘 1X1。 
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4 二 十 加 市 


(a) 棋盘 覆盖 (b)L 形 骨牌 
图 9.3 棋盘 覆盖 问题 


(a) 分 割 棋盘 (b) 骨牌 覆盖 较 小 棋盘 的 会 全 


图 9.4 分 治 算法 解决 棋盘 覆盖 问题 的 过 程 
算法 9.2 棋盘 覆盖 问题 的 分 治 算法 。 


void chessBoard( int tr, int tc, int dr, int dc, int size) 
//tr 和 tc 分 别 为 棋盘 左上 角 行 号 列 号 , dr 和 dc 分 别 为 特殊 方 格 的 行 号 列 号 ，size 为 棋盘 的 行列 数 
{ 


if (size == 1) return; 

int t = tilet+, / 代 形 骨牌 编号 

int s = size/2; // 分 割 棋盘 

// 覆 盖 左 上 角子 棋盘 

if (dr <tr + sg&&gdc<tc + s) // 特 殊 方 格 在 此 棋盘 中 
chessBoard(tr, tc, dr, dc, s); 

else { // 此 棋盘 中 无 特殊 方 格 
boardftz + .8 ~ 1[te + .s- 1] = € // 用 + 号 工 形 骨 牌 覆盖 右 下 角 


chessBoard(tr, tc, tr+s-l, tc+s-1, s);} // 覆 盖 其 余 方 格 
// 覆 盖 右 上 角子 棋盘 


if (dr<tr + sg&&dc>= tc + s) // 特 殊 方 格 在 此 棋盘 中 
chessBoard(tr, tc+s, dr, dc, s); 
else { // 此 棋盘 中 无 特殊 方 格 
board[tr + s- 1][tc + s] = t; // 用 + 上 号 工 形 骨 牌 覆盖 左下 角 
chessBoard(tr, tc+s, tr+s-1, tc+s, s);}  // 覆 盖 其 余 方 格 
// 覆 盖 左 下 角子 棋盘 
if (dr >= tr+ sg&&dc<tc + s) // 特 殊 方 格 在 此 棋盘 中 
chessBoard(tr+s, tc, dr, dc, s); 
else { // 此 棋盘 中 无 特殊 方 格 
board[tr + sl[tc + s- 1] =t; // 用 + 上 号 工 形 骨 牌 覆盖 右上 和 角 
chessBoard(tr + s, tc, tr+s, tc+s-1, s);} // 覆 盖 其 余 方 格 
// 覆 盖 右 下 角子 棋盘 


if (dr>= tr+sgsdc>= tc+ s) // 特 殊 方 格 在 此 棋盘 中 
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chessBoard(tr+s, tc+s, dr, dc, s); 


else { // 此 棋盘 中 无 特殊 方 格 
board[tr + sl[tc + s] = t; // 用 七 号 工 形 骨牌 覆盖 左上 角 
chessBoard(tr+s, tc+ s/ tr+s, tc+s, s);} // 覆 盖 其 余 方 格 

} 


6.3 动态 规划 算法 


动态 规划 算法 与 分 治 算法 类 似 , 也 是 将 求解 问题 分 解 成 若干 个 子 问题 , 先 求解 子 问题 ， 
然后 从 这 些 子 问题 的 解 得 到 原 问 题 的 解 。 与 分 治 算法 不 同 的 是 ,适用 于 用 动态 规划 算法 求 
解 的 问题 ,经 分 解 得 到 的 子 问题 往往 不 是 相互 独立 的 ,而 是 重 春 的 。 


9.3.1 动态 规划 算法 思想 及 设计 


动态 规划 算法 将 待 求解 问题 分 解 成 若干 个 相互 重 倒 的 子 问题 ,每 个 子 问题 对 应 决策 过 
程 的 一 个 阶段 ,一 般 来 说 , 子 问题 的 重 释 关系 表现 在 对 给 定 问 题 求解 的 递 推 关 系 ( 也 就 是 动 
态 规 划 函 数 ) 中 ,将 子 问 题 的 解 求解 一 次 并 填 入 表 中 , 当 需 要 再 次 求解 此 子 问 题 时 ,可 以 通过 
查 表 获 得 该 子 问题 的 解 而 不 用 再 次 求解 ,从 而 避免 了 大 量 重复 计算 。 

动态 规划 算法 的 求解 过 程 如 图 9.5 所 示 。 


原 问题 的 解 
图 9.5 动态 规划 算法 的 求解 过 程 
例 9.2 计算 斐 波 那 契 数 。 


0 姥 一 0 
二 7 一 1 《9 2 
本 
7 一 5 时 分 治 算法 计算 斐 波 那 契 数 的 过 程 如 图 9. 6 所 示 , 其 中 存在 大 量 的 重复 子 问题 ， 
如 下 (2) 子 问题 被 计算 3 次 。 
注意 到 计算 下 (n) 是 以 计算 它 的 两 个 重 释 子 问 题 F(n 一 1) 和 下 (n 一 2) 的 形式 来 表达 
的 ,所 以 可 以 设计 一 张 表 填 入 十 1 个 下 (n) 的 值 。 
动态 规划 算法 求解 斐 波 那 契 数 (9) 的 填 表 过 程 如 图 9.7 所 示 。 
用 动态 规划 算法 求解 的 问题 具有 以 下 特征 (适用 条 件 ): 
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F(5) 
F(4) F(3) 
F(3) F(2) F(2) RD 
FU2) F(1) RD F(0) FID F(0) 


F(1) F(0) 
图 9.6 7 一 5 时 分 治 算法 计算 斐 波 那 契 数 的 过 程 


| 4|s|s|7|s|， 
8 


3 
各 上 | 分 :上马 | 3 | 2 | 34 


司 功 司 攻 司 本 5 
Fn| 0 1 | 1 


图 9.7 动态 规划 算法 求解 斐 波 那 契 数 (9) 的 填 表 过 程 


。 能够 分 解 为 相互 重 倒 的 若干 子 问题 
。 满足 最 优 性 原理 (也 称 最 优 子 结构 性 质 ) ,该 问题 的 最 优 解 中 也 包含 着 其 子 问题 的 最 
优 解 。 

分 析 问 题 是 否 满足 最 优 性 原理 常用 反 证 法 : 

先 假设 由 问题 的 最 优 解 导出 的 子 问题 的 解 不 是 最 优 的 ; 然后 再 证 明 在 这 个 假设 下 可 构 
造 出 比 原 问题 最 优 解 更 好 的 解 ,从 而 导致 蔬 盾 。 

动态 规划 设计 算法 一 般 分 成 三 个 阶段 : 

(1) 分 段 ,将 原 问 题 分 解 为 若干 个 相互 重 倒 的 子 问题 ; 

(2) 分 析 , 分 析 问 题 是 否 满足 最 优 性 原理 , 找 出 动态 规划 函数 的 递 推 式 ; 

(3) 求解 ,利用 递 推 式 自 底 向 上 计算 ,实现 动态 规划 过 程 。 

动态 规划 算法 利用 问题 的 最 优 性 原理 :以 自 底 向 上 的 方式 从 子 问 题 的 最 优 解 逐步 构造 
出 整个 问题 的 最 优 解 。 


9.3.2 动态 规划 算法 应 用 实例 一 一 0/1 背包 问题 


0/1 背包 问题 是 指 给 定 n 种 物品 和 一 背包 ,物品 ;的 重量 是 rw; ,其 价值 为 w ,背包 的 容 
量 为 C。 问 应 如 何 选择 装 和 人 背包 的 物品 ,使 得 装 和 背包 中 物品 的 总 价值 最 大 ? 物品 i 或 者 
被 装 和 背包 ,或 者 不 被 装 和 人 背包 ,不 允许 只 装 和 一 部 分 。 

在 0/1 背包 问题 中 , 设 z; 表示 物品 i 装 入 背包 的 情况 , 则 当 zx; 二 0 时 ,表示 物品 i 没有 
被 装 入 背包 ,xz; 二 1 时 ,表示 物品 i 被 装 和 背包。 根据 问题 的 要 求 , 约 东 条 件 式 (9.3) 和 目标 
函数 式 (9. 4): 


> ioiri < 
i=1 《49.3) 
Xi€E1{0,1} (1 <i<n) 
max >) viz (9.4) 
i=1 


于 是 ,问题 归结 为 寻找 一 个 满足 约束 条 件 式 (9. 3) ,并 使 目标 函数 式 (9. 4) 达 到 最 大 的 解 


算法 与 数据 结构 (第 三 版 ) 


向 量 里 二 (zi srs "TI,)。 
下 面 证 明 0/1 背包 问题 满足 最 优 性 原理 。 
设 (ziyzs,…,zw) 是 所 给 0/1 背包 问题 的 一 个 最 优 解 , 则 (zs ,x;,…,zx,) 是 下 面 一 个 
子 问题 的 最 优 解 : 
Ss <C—wiz 
i=2 


rzi€E1{0,1} (2<i<n) 


n 
max > Ti 


如 车 不 然 , 设 (y,,…,y,) 是 上 述 子 问题 的 一 个 最 优 解 , 则 


Dviy; > Dvizs wiZzi 十 Dwiy <C 
因此 
ws > uiyi 2 二 > )uiri 一 > uiri 

这 说 明 (ziyysz,…，,y,) 是 所 给 0/1 背包 问题 比 (ziyzs,…,zv) 更 优 的 解 ,从 而 导致 
矛盾 。 

0/1 背包 问题 可 以 看 作 是 决策 一 个 序列 (zi ,zs*,…',zs) ,对 任 一 变量 x; 的 决策 是 决定 
zi 一 1 还 是 zx; 二 0。 在 对 zi-i 决策 后 ,已 确定 了 (zi,zi,…,zi-i) ,在 决策 zi; 时 ,问题 处 于 
下 列 两 种 状态 之 一 : 

(1) 背包 容量 不 足以 装 入 物品 i, 则 xz; 二 0, 背包 不 增加 价值 ; 

(2) 背包 容量 可 以 装 入 物品 二 , 则 z;=1, 背 包 的 价值 增加 了 w 。 

这 两 种 情况 下 背包 价值 的 最 大 者 应 该 是 对 x; 决策 后 的 背包 价值 。 令 V(i,j ) 表 示 在 前 
i(1 坟 i 过) 个 物品 中 能 够 装 入 容量 为 j (1 二 j 三 C) 的 背包 中 的 物品 的 最 大 值 , 则 可 以 得 到 动 
态 规 划 函 数 公 式 如 下 : 

0 i 或 j 为 0 
NR jw (9.5) 
max{VGi—1,7),VGi—1,)—w)+v} 了 二 mi 

式 (9.5) 表 明 : 把 前 面 i 个 物品 装 入 容量 为 0 的 背包 和 把 0 个 物品 装 入 容量 为 7 的 背 
包 , 得 到 的 价值 均 为 0。 如 果 第 i 个 物品 的 重量 大 于 背包 的 容量 , 则 装 入 前 i 个 物品 得 到 的 
最 大 价值 和 装 入 前 i 一 1 个 物品 得 到 的 最 大 价值 是 相同 的 , 即 物品 i 不 能 装 入 背包 。 如 果 第 
i 个 物品 的 重量 小 于 背包 的 容量 , 则 会 有 以 下 两 种 情况 : 如 果 把 第 i 个 物品 装 入 背包 , 则 
背包 中 物品 的 价值 等 于 把 前 i 一 1 个 物品 装 入 容量 为 j 一 w; 的 背包 中 的 价值 加 上 第 i 个 物 
品 的 价值 v;; @ 如 果 第 i 个 物品 没有 装 入 背包 , 则 背包 中 物品 的 价值 就 等 于 把 前 i 一 1 个 物 
品 装 入 容量 为 7 的 背包 中 所 取得 的 价值 。 显 然 , 取 二 者 中 价值 较 大 者 作为 把 前 i 个 物品 装 
入 容量 为 7 的 背包 中 的 最 优 解 。 

例 9.3 有 5 个 物品 ,其 重量 分 别 是 {2,2,6,5,4}) ,价值 分 别 为 {6,3,5,4,6) ,背包 的 容 
量 为 10。 根 据 动态 规划 函数 ,使 用 一 个 (x 十 1)X (C 十 1) 的 二 维 表 ,V[i][j] 表 示 把 前 i 个 
物品 装 入 容量 为 7 的 背包 中 获得 的 最 大 价值 ,其 求解 过 程 如 图 9. 8 所 示 。 
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ololo 
w=2u611010 
w=2 v=321010 
w=6 v=5310 .0 | 
Wa=5 Us=4 4 0 10 | 
Ws=5 Us=6 5 可 0 | 


图 9.8 动态 规划 算法 解决 0/1 背包 问题 的 过 程 
第 一 阶段 ,只 装 入 前 1 个 物品 ,确定 在 各 种 情况 下 的 背包 能 够 得 到 的 最 大 价值 ; 第 二 阶 
段 ,只 装 和 前 2 个 物品 ,确定 在 各 种 情况 下 的 背包 能 够 得 到 的 最 大 价值 ; 以 此 类 推 ,直到 第 
nn 个 阶段 。 最 后 ,V(n,C) 便 是 在 容量 为 C 的 背包 中 装 入 个 物品 时 取得 的 最 大 价值 。 为 
了 确定 装 人 背包 的 具体 物品 ,从 V(z ,C) 的 值 向 前 推 ,如 果 V(z,C) 二 VC 一 1,C) ,表明 第 ? 
个 物品 被 装 和 人 背包 ,前 7 一 1 个 物品 被 装 入 容量 为 C 一 w, 的 背包 中 ; 否则 ,第 n 个 物品 没有 
被 装 人 背包 ,前 ?一 1 个 物品 被 装 和 容量 为 C 的 背包 中 。 以 此 类 推 ,直到 确定 第 1 个 物品 是 


否 被 装 入 背包 中 为 止 。 由 此 ,得 到 函数 式 (9. 6) : 
0 V(i,j)=V(i—1,j)) 
= (9.6) 
1 一 ) 一 zi V(i,j)> VGi—1,) 

设 n 个 物品 的 重量 存储 在 数组 w[n] 中 ,价值 存储 在 数组 v[n] 中 ,背包 容量 为 C, 数 组 
VLn 十 1JLC 十 1] 存 放 迭 代 结 果 , 其 中 V[Lij[Lj] 表 示 前 i 个 物品 装 入 容量 为 j 的 背包 中 获得 
的 最 大 价值 ,数组 xz[Lnj 存 储 装 入 背包 的 物品 ,动态 规划 算法 求解 0/1 背包 问题 的 算法 如 算 
法 9.3。 

算法 9.3 0/1 背包 问题 的 动态 规划 算法 。 

int KnapSack( int n, int w[]，int v[], int C, int x[]) 

{ 


for(i=0; i<=n; i++) // 初 始 化 第 0 列 
V[i][0] =0; 
for(j=0; j<=C; j++) // 初 始 化 第 0 行 
Vv[Io][j]=0; 
for(i=1; i<=n; i++) // 计 算 第 行 ,进行 第 i 次 迭代 


for(j=1; j<=C; j++) 
if(j<w[il]) 
VIi[j] = vi- 1][j]; 
else 
VIi][j] = max(V[i= 1][j], VIi-1][j-w[i]] +v[i]); 
j=C; // 求 装 和 人 背包 的 物品 
For(4=.0 3 
{ 
if£(V[i][j]> vi-1][j]) { 
x[i] =1; 
j=j-wi]; } 
else x[i] =0; 


284 


A 


算法 与 数据 结构 (第 三 版 ) 


} 
return V[n][C]; // 返 回 背包 取得 的 最 大 价值 
} 
在 算法 9. 3 中 ,第 一 个 for 循环 的 时 间 复 杂 度 是 O(n) ,第 二 个 for 循环 的 时 间 复 杂 度 是 
O(C), 第 三 个 循环 是 两 层 嵌 套 的 for 循环 ,其 时 间 复 杂 度 是 O(zXC) ,第 四 个 for 循环 的 时 
间 复 杂 度 是 O(n), 所 以 ,算法 9. 3 的 时 间 复 杂 度 为 O(n XC)。 


8.4 贪心 算法 


当 一 个 问题 具有 最 优 子 结构 性 质 时 ,可 用 动态 规划 算法 求解 ,但 用 贪心 算法 会 更 简单 
有 效 。 


9.4.1 贪心 算法 技术 思想 


贪心 算法 在 解决 问题 的 策略 上 目光 短 浅 ,只 根据 当前 已 有 的 信息 就 做 出 选择 ,而 且 一 旦 
做 出 了 选择 ,不 管 将 来 有 什么 结果 ,这 个 选择 都 不 会 改变 。 换 言 之 ,贪心 算法 并 不 是 从 整体 
最 优 考 虑 , 它 所 做 出 的 选择 只 是 在 某 种 意义 上 的 局 部 最 优 。 这 种 局 部 最 优选 择 并 不 总 能 获 
得 整体 最 优 解 ,但 通常 能 获得 近似 最 优 解 。 

例 9.4 用 贪心 算法 求解 付款 问题 。 

假设 有 面值 为 5 元 .2 元 .1 元 .5 角 .2 角 、1 角 的 货币 ,需要 找 给 顾客 4 元 6 角 现 金 ,为 
使 付出 的 货币 的 数量 最 少 ,首先 选 出 1 张 面值 不 超过 4 元 6 角 的 最 大 面值 的 货币 , 即 2 元 ， 
再 选 出 1 张 面值 不 超过 2 元 6 角 的 最 大 面值 的 货币 , 即 2 元 ,再 选 出 1 张 面值 不 超过 6 角 的 
最 大 面值 的 货币 , 即 5 角 , 再 选 出 1 张 面值 不 超过 1 角 的 最 大 面值 的 货币 , 即 1 角 , 总 共 付出 
4 张 货币 。 

在 付款 问题 每 一 步 的 贪心 选择 中 ,在 不 超过 应 付款 金额 的 条 件 下 ,只 选择 面值 最 大 的 货 
币 ,而 不 去 考虑 在 后 面 看 来 这 种 选择 是 否 合理 ,而 且 它 还 不 会 改变 决定 : 一 旦 选 出 了 一 张 货 
币 ,就 永远 选 定 。 付 款 问 题 的 贪心 选择 策略 是 尽 可 能 使 付出 的 货币 最 快 地 满足 支付 要 求 ,其 
目的 是 使 付出 的 货币 张 数 最 慢 地 增加 ,这 正体 现 了 贪心 法 的 设计 思想 。 

贪心 算法 求解 的 问题 的 特征 (适用 条 件 ) 如 下 。 

(1) 最 优 子 结构 性 质 。 当 一 个 问题 的 最 优 解 包含 其 子 问题 的 最 优 解 时 , 称 此 问题 具有 
最 优 子 结构 性 质 ,也 称 此 问题 满足 最 优 性 原理 。 

(2) 贪心 选择 性 质 。 贪 心 选择 性 质 是 指 问 题 的 整体 最 优 解 可 以 通过 一 系列 局 部 最 优 的 
选择 , 即 贪心 选择 来 得 到 。 

动态 规划 算法 通常 以 自 底 向 上 的 方式 求解 各 个 子 问 题 , 而 贪心 算法 则 通常 以 自 顶 向 下 
的 方式 做 出 一 系列 的 贪心 选择 。 


9.4.2 贪心 算法 设计 


用 贪心 算法 求解 问题 应 该 考虑 如 下 几 个 方面 。 
(1) 候选 集合 C : 为 了 构造 问题 的 解决 方案 ,有 一 个 候选 集合 C 作为 问题 的 可 能 解 , 即 
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问题 的 最 终 解 均 取 自 于 候选 集合 C。 例 如 ,在 付款 问题 中 ,各 种 面值 的 货币 构成 候选 集合 。 

(2) 解 集合 S: 随 着 贪心 选择 的 进行 , 解 集合 S 不 断 扩展 ,直到 构成 一 个 满足 问题 的 完 
整 解 。 例 如 ,在 付款 问题 中 ,已 付出 的 货币 构成 解 集合 。 

(3) 解决 函数 solution(): 检查 解 集合 S 是 否 构 成 问题 的 完整 解 。 例 如 ,在 付款 问题 
中 ,解决 函数 是 已 付出 的 货币 金额 恰好 等 于 应 付款 。 

(4) 选择 函数 select() : 即 贪心 策略 ,这 是 贪心 算法 的 关键 , 它 指出 哪个 候选 对 象 最 有 
希望 构成 问题 的 解 ,选择 函数 通常 和 目标 函数 有 关 。 例 如 ,在 付款 问题 中 ,贪心 策略 就 是 在 
候选 集合 中 选择 面值 最 大 的 货币 。 

(5) 可 行 函 数 feasible() : 检查 解 集合 中 加 入 一 个 候选 对 象 是 否 可 行 , 即 解 集合 扩展 后 
是 否 满足 约束 条 件 。 例 如 ,在 付款 问题 中 ,可 行 函数 是 每 一 步 选择 的 货币 和 已 付出 的 货币 相 


加 不 超过 应 付款 。 
贪心 算法 的 一 般 过 程 : 
Greedy(C) //C 是 问题 的 输入 集合 即 候选 集合 
{ 
S={ 和 // 初 始 解 集合 为 空 集 
while( not solution(S)) // 集 合 S 没 有 构成 问题 的 一 个 解 
{ 
x= select(C); // 在 候选 集合 c 中 做 贪心 选择 
if feasible(S, x) // 判 断 集合 S 中 加 入 x 后 的 解 是 否 可 行 
s=s+ (x); 
C=C- {x}; 
} 
return S; 


} 


9.4.3 贪心 算法 应 用 实例 一 一 背包 问题 


背包 问题 是 指 给 定 n 种 物品 和 一 个 容量 为 C 的 背包 ,物品 i 的 重量 是 wi ,其 价值 为 v;， 
如 何 选择 装 和 背包 的 物品 ,使 得 装 和 人 背包 中 物品 的 总 价值 最 大 ? 背包 问题 可 以 让 物品 放 入 
一 部 分 。 

设 r; 表示 物品 i 装 和 人 背包 的 情况 ,根据 问题 的 要 求 , 有 约束 条 件 式 (9.7) 和 目标 函数 
式 (9. 8): 


> roiri 一 C 

i=1 《9.7 
0 和 Zi 和 1 (si 过 nz) 
max >)uiri (9. 8) 


于 是 ,背包 问题 归结 为 寻找 一 个 满足 约束 条 件 式 (9.7) ,并 使 目标 函数 式 (9. 8) 达 到 最 大 
的 解 向 量 系 王 (zz zo)。 

至 少 有 三 种 看 似 合理 的 贪心 策略 : 

(1) 选择 价值 最 大 的 物品 ,因为 这 可 以 尽 可 能 快 地 增加 背包 的 总 价值 。 但 是 ,虽然 每 一 
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步 选 择 获得 了 背包 价值 的 极 大 增长 ,但 背包 容量 却 可 能 消耗 得 太 快 ,使 得 装 入 背包 的 物品 个 
数 减少 ,从 而 不 能 保证 目标 函数 达到 最 大 。 

(2) 选择 重量 最 轻 的 物品 ,因为 这 可 以 装 和 人 尽 可 能 多 的 物品 ,从 而 增加 背包 的 总 价值 。 
但 是 ,虽然 每 一 步 选 择 使 背包 的 容量 消耗 得 慢 了 ,但 背包 的 价值 却 没 能 保证 迅速 增长 ,从 而 
不 能 保证 目标 函数 达到 最 大 。 

(3) 选择 单位 重量 价值 最 大 的 物品 ,在 背包 价值 增长 和 背包 容量 消耗 两 者 之 间 寻 找 
平衡 。 

应 用 第 三 种 贪心 策略 ,每 次 从 物品 集合 中 选择 单位 重量 价值 最 大 的 物品 ,如 果 其 重量 小 
于 背包 容量 ,就 可 以 把 它 装 入 ,并 将 背包 容量 减 去 该 物品 的 重量 ,然后 我 们 就 面临 一 个 最 优 
子 问题 一 一 同样 是 背包 问题 ,只 不 过 背包 容量 减少 了 ,物品 集合 减少 了 。 因 此 背包 问题 具有 
最 优 子 结构 性 质 。 

例 9.5 有 3 个 物品 ,其 重量 分 别 是 {20,30,10) ,价值 分 别 为 160,120,50} ,背包 的 容量 
为 50, 应 用 三 种 贪心 策略 装 入 背包 的 物品 和 获得 的 价值 如 图 9. 9 所 示 。 


20 20/30 10/20| 
50 20 0 
20 | | 30 30 
10 10 
60 120 50 背包 180 190 200 
(a) 3 个 物品 及 背包 (b) 贪心 策略 1 (c) 贪心 策略 2 (d) 贪心 策略 3 


图 9.9 贪心 算法 解决 背包 问题 的 三 种 策略 


设 背 包容 量 为 C, 共 有 nn 个 物品 ,物品 重量 存放 在 数组 w[Lnj 中 ,价值 存放 在 数组 v[Ln] 
中 ,问题 的 解 存放 在 数组 z[Lnj 中 。 

算法 9.4 背包 问题 的 贪心 算法 。 

void Knapsack( int n, float C, float v[],float w[],float x[]) 


{ float c= C; 
int i,t[N+1]; 


Sort(n,v,w, t); // 根 据 单位 重量 价值 非 递 增 排 序 ,把 排序 后 物品 编号 存在 t 数 组 中 
for(i=1;i<=n;it+) // 初 始 化 
x[t[i]] =0; 


for(i=1;i<=n;it+) 

: 
if (w[t[i]]> c) break; 
x[t[i]] =1; 
c-=w[t[i]]; 

} 

if(i<=n) 
x[t[i]] = c/w[t[i]]; 

} 


算法 9.4 的 时 间 主 要 消耗 在 将 各 种 物品 依 其 单位 重量 的 价值 从 大 到 小 排序 。 因 此 ,其 
时 间 复 杂 度 为 O(nlbn)。 
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6.5 回溯 算法 


穷 举 算法 是 对 所 有 的 解 进行 搜索 ,效率 较 低 ; 回溯 算法 是 穷 举 算法 的 改进 ,对 部 分 解 进 
行 增 量 、 构 建 式 搜索 过 程 ,采用 “试探 性 ”构建 法 则 。 回 溯 算 法 系统 对 解 空 间 进 行 搜索 并 进行 
规约 和 修剪 ,效率 要 优 于 穷 举 算法 ,并 且 可 以 解决 贪心 算法 和 动态 规划 算法 无 法 解决 的 一 些 
问题 。 


9.5.1 回溯 算法 有 关 概 念 


回溯 算法 的 搜索 对 象 是 解 空间 ,如 果 没 有 确定 正确 的 解 空间 就 开始 搜索 ,可 能 会 增加 很 
多 重复 解 ,或 者 根本 就 搜索 不 到 正确 的 解 。 


1. 问题 的 解 空间 


复杂 问题 常常 有 很 多 的 可 能 解 ,这 些 可 能 解构 成 了 问题 的 解 空间 。 解 空间 也 就 是 进行 
穷 举 的 搜索 空间 ,所 以 , 解 空间 中 应 该 包括 所 有 的 可 能 解 。 

对 于 任何 一 个 问题 ,可 能 解 的 表示 方式 和 它 相 应 的 解释 隐 含 了 解 空间 及 其 大 小 。 

例如 ,对 于 及 个 物品 的 0/1 背包 问题 ,其 可 能 解 的 表示 方式 可 以 有 以 下 两 种 : 

(1) 可 能 解 由 一 个 不 等 长 向 量 组 成 , 当 物品 i(1 志 i 二 n) 装 入 背包 时 , 解 向 量 中 包含 分 量 
i 否则 , 解 向 量 中 不 包含 分 量 i, 当 n= 二 3 时 ,其 解 空间 是 {O,(1),(2),(3),(1,2),(1,3)， 
A 0 

(2) 可 能 解 由 一 个 等 长 向 量 {zi ,zx,,…,z,} 组 成 ,其 中 zz; 二 1(1 志 i <n) 表 示 物 品 i 装 
入 背包 ,x; 二 0 表示 物品 i 没有 装 入 背包 , 当 n 二 3 时 ,其 解 空 间 是 {(0,0,0),(0,0,1),(0,1， 
CD dD (oy Wy DE gr NN DR 1 Wt od Wy Ch 

为 了 用 回溯 算法 求解 一 个 具有 个 输入 的 问题 ,一 般 情况 下 ,将 其 可 能 解 表示 为 满足 
某 个 约束 条 件 的 等 长 向 量 半 三 (x1 ,zs，… ,zx,) ,其 中 分 量 x; (1 二 i 三 n) 的 取 值 范围 是 某 个 
有 限 集 合 S; 二 {an ,ais，…,as ), 所 有 可 能 的 解 向 量 构成 了 问题 的 解 空 间 。 


2. 解 空间 树 


问题 的 解 空间 一 般 用 解 空 间 树 (也 称 状态 空间 树 ) 的 方式 组 织 , 树 的 根 结 点 位 于 第 1 层 ， 
表示 搜索 的 初始 状态 ,第 2 层 的 结 点 表示 对 解 向 量 的 第 一 个 分 量 做 出 选择 后 到 达 的 状态 ,第 
1 层 到 第 2 层 的 边 上 标 出 对 第 一 个 分 量 选择 的 结果 .以 此 类 推 ,从 树 的 根 结 点 到 叶子 结 点 的 
路 径 就 构成 了 解 空间 的 一 个 可 能 解 。 

对 于 二 3 的 0/1 背包 问题 ,其 解 空间 树 如 图 9. 10 所 示 , 树 中 的 8 个 叶子 结 点 分 别 代表 
该 问题 的 8 个 可 能 解 。 

旅行 商 问题 (Traveling Salesman Problem ,TSP) 又 译 为 旅行 推销 员 问 题 , 货 郎 担 问题 。 
假设 有 一 个 旅行 商人 要 拜访 ”个 城市 ,他 必须 选择 所 要 走 的 路 径 , 路 径 的 限制 是 每 个 城市 
只 能 拜访 一 次 ,而 且 最 后 要 回 到 原来 出 发 的 城市 。 路 径 的 选择 目标 是 要 求 得 的 路 径路 程 为 
所 有 路 径 之 中 的 最 小 值 。 对 于 nn 二 4 的 TSP, 其 解 空间 树 如 图 9. 11 所 示 , 树 中 的 24 个 叶子 


图 9.10 n=3 的 0/1 背包 问题 的 解 空间 树 


结 点 分 别 代表 该 问题 的 24 个 可 能 解 , 例 如 结 点 5 代表 一 个 可 能 解 ,路 径 为 1~2- 一 3 一 4~1， 
长 度 为 各 边 代价 之 和 。 
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图 9.11 n==4 的 TSP 的 解 空间 树 


问题 的 解 空间 树 一 般 分 为 子 集 树 和 排列 树 两 种 结构 , 子 集 树 的 解 空间 中 解 的 数目 为 
2" ,排列 树 的 解 空间 中 解 的 数目 为 n1。 

需要 注意 的 是 ,问题 的 解 空间 树 是 虚拟 的 ,并 不 需要 在 算法 运行 时 构造 一 棵 真正 的 树 结 
构 , 只 需要 存储 从 根 结 点 到 当前 结 点 的 路 径 。 


9.5.2 回溯 算法 思想 


回溯 算法 思想 : 从 根 结 点 出 发 ,按照 深度 优先 策略 遍历 解 空间 树 ,搜索 满足 约束 条 件 的 
解 。 在 搜索 至 树 中 任意 结 点 时 , 先 判断 该 结 点 对 应 的 部 分 解 是 否 满足 约束 条 件 ,或 者 是 否 超 
出 目标 函数 的 界 , 也 就 是 判断 该 结 点 是 否 包含 问 题 的 (最 优 ) 解 ,如 果 肯 定 不 包含 , 则 跳 过 对 
以 该 结 点 为 根 的 子 树 的 搜索 , 即 所 谓 剪 枝 (pruning); 否则 ,进入 以 该 结 点 为 根 的 子 树 ,继续 
按照 深度 优先 策略 搜索 。 

例 9.6 对 于 "= 一 3 的 0/1 背包 问题 ,3 个 物品 的 重量 为 {20,15,10} ,价值 为 {20,30， 
25} ,背包 容量 为 25, 从 图 9. 10 所 示 的 解 空 间 树 的 根 结 点 开始 搜索 ,搜索 过 程 如 图 9. 12 所 
示 , 其 中 3 号 结 点 因 不 满足 约束 条 件 即 不 小 于 背包 的 容量 而 被 剪 枝 。 
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例 9.7 对 于 n==4 的 TSP, 其 代价 和 矩阵 如 图 9.13 所 示 , 其 搜索 过 程 如 图 9. 14 所 示 。 


wm 3 6 7 

12 mo 2 8 

8 6 om 2 

不 可 行 解 ”价值 =20 ”价值 =55 价值 =30 价值 =25 价值 =0 3 7 om 6 
图 9.12 回溯 算法 搜索 过 程 图 9.13 7 一 4 的 TSP 代价 矩阵 


图 9.14 ?一 4 的 TSP 的 搜索 空间 


在 搜索 解 空间 树 的 过 程 中 ,一 个 正在 被 访问 ,满足 约束 条 件 且 存在 还 没有 被 访问 的 儿子 
结 点 的 结 点 称 为 活 结 点 ; 一 个 不 满足 约束 条 件 或 者 目标 函数 的 界 或 所 有 儿子 已 经 被 访问 的 
结 点 称 为 死结 点 ,如 叶子 结 点 都 是 死结 点 ; 一 个 正在 被 访问 的 活 结 点 以 及 它 所 有 的 父 结 点 
和 祖父 结 点 称 为 扩展 结 点 。 


9.5.3 ”回溯 算法 设计 


有 许多 问题 , 当 需 要 找 出 它 的 解 集 或 者 要 求 回答 什么 解 是 满足 某 些 约束 条 件 的 最 佳 解 
时 ,往往 要 使 用 回溯 算法 (通用 的 解 题 法 ) 。 

回溯 算法 的 基本 做 法 是 深度 优先 搜索 , 既 有 系统 性 又 带 跳跃 性 的 搜索 ,能 避免 不 必要 搜 
索 的 穷 举 式 搜索 法 。 

回溯 算法 的 搜索 过 程 涉及 的 结 点 ( 称 为 搜索 空间 ) 只 是 整个 解 空间 树 的 一 部 分 ,在 搜索 
过 程 中 ,通常 采用 两 种 策略 避免 无 效 搜索 (这 两 类 函数 统称 为 前 枝 函 数 ): 

(1) 用 约束 条 件 剪 去 得 不 到 可 行 解 的 子 树 ; 

(2) 用 目标 函数 剪 去 得 不 到 最 优 和解 的 子 树 。 
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回溯 算法 的 基本 步骤 : 
(1) 针对 所 给 问题 ,定义 问题 的 解 空间 ; 
(2) 确定 易于 搜索 的 解 空间 结构 ; 
(3) 以 深度 优先 方式 搜索 解 空间 ,并 在 搜索 过 程 中 用 剪 枝 函数 避免 无 效 搜索 。 
常用 前 校 函数 : 
(1) 用 约 东 函数 在 扩展 结 点 处 剪 去 不 满足 约束 的 子 树 ; 
(2) 用 限界 函数 剪 去 得 不 到 最 优 解 的 子 树 。 
回溯 算法 对 解 空 间 做 深度 优先 搜索 ,一 般 情况 下 可 用 递归 回溯 算法 来 实现 ( 见 算法 9. 5)。 
算法 9.5 ”递归 回溯 算法 。 
void backtrack (int t) //t 表示 递归 深度 
{ //f(nvt) :当前 扩展 结 点 未 搜索 子 树 的 起 始 编号 
//g(n't) :当前 扩展 结 点 未 搜索 子 树 的 终止 编号 
if(t>n) output(x); 
else 
for(int i=f(n,t);i<=g(n,t);i++) { 
x[t] = h(i); // 当 前 扩展 结 点 x[t] 第 i 个 可 选项 
if (constraint(t)&&bound(t)) backtrack(t+1); // 约 束 函 数 和 限界 函数 
} 
} 


采用 树 的 非 递 归 深 度 优先 遍历 算法 ,可 将 回溯 算法 表示 为 一 个 非 递 归 迭 代 算法 ,如 算 


法 9.6 所 示 。 


算法 9.6 过 代 回溯 算法 。 


void iterativeBacktrack() 
{ intt=1; 
while(t >0) { 
if(f(n,t)<= g(n,t)) 
for(int i=f(n,t);i<=g(n,t);i++) { 
x[t] = h(i); 
if(constraint(t)&&bound(t)) { 
if(solution(t) ) output (x); 


else t++;} //end if (constraint(t)&sbound(t) ) 
} //end for 
elset——; 
} //end while (t> 0) } 


回溯 算法 对 子 集 树 做 深度 优先 搜索 ,其 递归 函数 结构 如 算法 9. 7 所 示 。 
算法 9.7 子 集 树 的 递归 回溯 算法 。 


void backtrack (int t) 
{ 
if(t>n) output (x); 
else 
for(int i=0;i<=1;i+t+) { 
x[t] = i; 
if(legal(t)) backtrack(t+ 1); 
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} 


回溯 算法 对 排列 树 做 深度 优先 搜索 ,其 递归 函数 结构 如 算法 9. 8 所 示 。 
算法 9.8 排列 树 的 递归 回溯 算法 。 
void backtrack( int 七 ) 
{ 
if(t>n) output (x); 
else 
for(int i=t;i<=n;i+t+) { 
swap(x[t], x[i]); 
if(legal(t)) backtrack(t+1); 
swap(x[t], x[i]); 
} 
» 
在 任何 时 刻 , 算 法 只 保存 从 根 结 点 到 当前 扩展 结 点 的 路 径 。 
如 果 解 空间 树 中 从 根 结 点 到 叶 结 点 的 最 长 路 径 的 长 度 为 h(n), 则 回溯 算法 所 需 的 计算 
空间 通常 为 O(h(n))。 显 式 地 存储 整个 解 空间 则 需要 OC2”") 或 OCh(n)1)。 


9.5.4 ”回溯 算法 应 用 实例 一 一 装载 问题 
共 个 集装箱 要 装 上 两 艘 载重 量 分 别 为 c, 和 c* 的 轮船 ,其 中 集装箱 ; 的 重量 为 ww， 


es 三 ci 十 cso， 装载 问题 要 求 确定 是 否 有 一 个 合理 的 装载 方案 ,可 将 这 批 集装箱 装 上 


这 两 般 轮 船 。 

容易 证 明 ,采用 首先 将 第 一 盘 轮 船 尽 可 能 装 满 然 后 将 剩余 的 集装箱 装 上 第 二 条 轮船 的 
策略 可 得 到 最 优 装载 方案 。 将 第 一 盘 轮 船 尽 可 能 装 满 等 价 于 选取 全 体 集 装 箱 的 一 个 子 集 ， 
使 该 子 集中 集装箱 重量 之 和 最 接近 c， 。 

装载 问题 的 解 空间 为 子 集 树 ,可 行 性 约束 函数 (选择 当前 元 素 ): cw 十 w[i] 坊 c ,限界 函 
数 (不 选择 当前 元 素 ): 当前 载重 量 cw 十 剩余 集装箱 的 重量 三 当前 最 优 载 重量 bestw。 

算法 9.9 ”装载 问题 的 递归 回溯 算法 。 


void backtrack( int i) // 递 归 回 溯 
{ // 搜 索 第 i 层 结 点 
if(i>n) // 到 达 叶 结 点 
{bestw = cw; return;} 
r-= w[i]; 
if(cw + w[i] <= c) { // 搜 索 左 子 树 
x[i] = 1; 


cw += w[i]; 
backtrack(i + 1); 
cw -= w[il]; } 

if(cw + r> bestw) { 
x{i] = 0; // 搜 索 右 子 树 
backtrack(i + 1); } 

r+= w[i]; 
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算法 9. 10 ”装载 问题 的 迭代 回溯 算法 。 


void maxloading( type w[ ], type cv int n, int bestx[ ]) // 迁 代 回 漳 
{ int i=1,int *x=newint [n+1]; // 当 前 层 ,x[1..i 一 1] 为 当前 路 径 


Type bestw= 0,cw= 0,r=0; 
for(int j=1;j<=n;j++) r+=w[j]; 


while(true){ 
while(i<= nggcw+w[i]<=c){ // 进 入 左 子 树 
r -= wlil;cwt+=w[i];x[i] =1;i++} 
if(i>n) { // 到 达 叶子 


for (int j=1;j<=n;j++) 
bestx[j] = x[j];bestw= cw;} 


else { // 搜 索 右 子 树 
r-=wli];x[i] = 0;it+;} 
while(cw + r<=bestw) { // 剪 枝 回溯 
i-——; 
while (i> 0g&!x[i]){ // 从 右 子 树 返 回 


r+=w[i];i-—;} 
if(i==0) {delete [ ]x;return bestw;} 
x[i] =0;cw—= w[i];it+; 


a 


@.6 分 支 限界 算法 


分 支 限界 算法 类 似 于 回溯 算 法 ,也 是 在 解 空间 上 搜索 问题 解 的 算法 ,但 在 求解 目标 和 搜 
索 方 式 上 不 同 。 


9.6.1 分 支 限 界 算法 思 ? 


分 支 限界 算法 与 回溯 算法 的 区 别 如 下 。 

(1) 求解 目标 : 回溯 算法 的 求解 目标 是 找 出 解 空间 树 中 满足 约束 条 件 的 所 有 解 ,而 分 
支 限 界 算法 的 求解 目标 则 是 找 出 满足 约束 条 件 的 一 个 解 ,或 是 在 满足 约束 条 件 的 解 中 找 出 
在 某 种 意义 下 的 最 优 解 。 

(2) 搜索 方式 的 不 同 : 回溯 算法 以 深度 优先 的 方式 搜索 解 空间 树 ,而 分 支 限 界 算 法 则 
以 广度 优先 或 以 最 小 耗费 优先 的 方式 搜索 解 空间 树 。 

分 支 限界 算法 首先 确定 一 个 合理 的 限界 函数 ,并 根据 限界 函数 确定 目标 函数 的 界 
[down,up]。 然 后 按照 广度 优先 策略 遍历 问题 的 解 空间 树 ,在 分 支 结 点 上 ,依次 搜索 该 结 点 
的 所 有 孩子 结 点 ,分别 估 算 这 些 孩 子 结 点 的 目标 函数 的 可 能 取 值 , 如 果 某 孩子 结 点 的 目标 函 
数值 可 能 超出 目标 函数 的 界 , 则 将 其 丢弃 ,因为 从 这 个 结 点 生成 的 解 不 会 比 目 前 已 经 得 到 的 
解 更 好 ; 否则 ,将 其 加 入 待 处 理 结 点 表 ( 以 下 简称 表 PT) 中 。 依 次 从 表 PT 中 选取 使 目标 函 
数 的 值 取得 极 值 的 结 点 成 为 当前 扩展 结 点 ,重复 上 述 过 程 ,直到 找到 最 优 解 。 

随 着 遍历 过 程 的 不 断 深入 , 表 PT 中 所 估算 的 目标 函数 的 界 越 来 越 接 近 问 题 的 最 优 解 。 
当 搜索 到 一 个 叶子 结 点 时 ,如 果 该 结 点 的 目标 函数 值 是 表 PT 中 的 极 值 (对 于 最 小 化 问题 ， 
是 极 小 值 ; 对 于 最 大 化 问题 ,是 极 大 值 ), 则 该 叶子 结 点 对 应 的 解 就 是 问题 的 最 优 解 ; 否则 ， 
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根据 这 个 叶子 结 点 调整 目标 函数 的 界 ( 对 于 最 小 化 问题 ,调整 上 界 ; 对 于 最 大 化 问题 ,调整 
下 界 ) ,依次 考察 表 PT 中 的 结 点 ,将 超出 目标 函数 界 的 结 点 丢弃 ,然后 从 表 PT 中 选取 使 目 
标 函 数 取 得 极 值 的 结 点 继续 进行 扩展 。 

例 9.8 0/1 背包 问题 。 假 设 有 4 个 物品 ,其 重量 分 别 为 {4,7,5,3} ,价值 分 别 为 {40， 
42,25,12} ,背包 容量 W=10。 

首先 ,将 给 定 物品 按 单位 重量 价值 从 大 到 小 排序 ,排序 结果 如 表 9. 1 所 示 。 


表 9.1 0/1 背包 问题 按 单位 重量 价值 从 大 到 小 排序 结果 


物 品 重量 /w 价值 /2 价值 /重量 /2*w” 
和 4 40 10 
2 六 42 6 
9 5 站 5 
4 3 12 4 


应 用 贪心 法 求 得 近似 解 为 {1,0,0,0}) ,获得 的 价值 为 40, 这 可 以 作为 0/1 背包 问题 的 下 
界 。 如 何 求 得 0/1 背包 问题 的 一 个 合理 的 上 界 呢 ? 考虑 最 好 情况 ,背包 中 装 入 的 全 部 是 第 
1 个 物品 且 可 以 将 背包 装 满 , 则 可 以 得 到 一 个 非常 简单 的 上 界 的 计算 方法 : ub 二 WX (vi/ 
zol) 王 10X10=100。 于 是 得 到 了 目标 函数 的 界 [40,100]。 
限界 函数 为 
b=v 十 (W 一 w) X 字 于 (9.9) 


分 支 限 界 算法 求解 0/1 背包 问题 的 过 程 如 图 9. 15 所 示 。 


w=0, v=0 
ub=100 
弛 3 
w=4, U=40 w=0,v=0 
ub=76 ub=60 
4 x 5 
w=11 w=4. v=40 
无 效 解 ub=70 
6 
w=9, u=65 w=4, v=40 
ub=69 ub=64 
8 x 9 
w=12 W=9, v=65 
无 效 解 ub=65 


图 9.15 分 支 限界 算法 求解 0/1 背包 问题 的 过 程 


分 支 限界 法 求解 0/1 背包 问题 ,其 搜索 空间 如 图 9. 15 所 示 ,具体 的 搜索 过 程 如 下 。 
(1) 在 根 结 点 1, 没 有 将 任何 物品 装 人 背包 ,因此 ,背包 的 重量 和 获得 的 价值 均 为 0, 根 


293 


NA 


294。 ”算法 与 数据 结构 (第 三 版 ) 
NA 


据 限界 函数 计算 结 点 1 的 目标 函数 值 为 10X10 一 100。 

(2) 在 结 点 2, 将 物品 1 装 入 背包 ,因此 ,背包 的 重量 为 4, 获 得 的 价值 为 40, 目 标 函 数值 
为 40 十 (10 一 4)X6 二 76, 将 结 点 2 加 入 待 处 理 结 点 表 PT 中 ; 在 结 点 3, 没 有 将 物品 1 装 和 人 
背包 ,因此 ,背包 的 重量 和 获得 的 价值 仍 为 0, 目标 函数 值 为 10X6=60, 将 结 点 3 加 入 表 
PT 中 

(3) 在 表 PT 中 选取 目标 函数 值 取得 极 大 的 结 点 2 优先 进行 搜索 。 

(4) 在 结 点 4, 将 物品 2 装 和 背包 ,因此 ,背包 的 重量 为 11, 不 满足 约束 条 件 , 将 结 点 4 
丢弃 ; 在 结 点 5, 没 有 将 物品 2 装 人 背包 ,因此 ,背包 的 重量 和 获得 的 价值 与 结 点 2 相同 , 目 
标 函 数值 为 40 十 (10 一 4) X5 王 70, 将 结 点 5 加 入 表 PT 中 。 

(5) 在 表 PT 中 选取 目标 函数 值 取得 极 大 的 结 点 5 优先 进行 搜索 。 

(6) 在 结 点 6, 将 物品 3 装 入 背包 ,因此 ,背包 的 重量 为 9, 获得 的 价值 为 65, 目 标 函 数值 
为 65 十 (10 一 9)X4 一 69, 将 结 点 6 加 入 表 PT 中 ; 在 结 点 7, 没有 将 物品 3 装 入 背包 ,因此 ， 
背包 的 重量 和 获得 的 价值 与 结 点 5 相同 ,目标 函数 值 为 40 十 (10 一 4) X4 一 64, 将 结 点 7 加 
入 表 PT 中 。 

(7) 在 表 PT 中 选取 目标 函数 值 取得 极 大 的 结 点 6 优先 进行 搜索 。 

(8) 在 结 点 8, 将 物品 4 装 入 背包 ,因此 ,背包 的 重量 为 12, 不 满足 约束 条 件 , 将 结 点 8 
丢弃 ; 在 结 点 9, 没 有 将 物品 4 装 人 背包 ,因此 ,背包 的 重量 和 获得 的 价值 与 结 点 6 相同 , 目 
标 函数 值 为 65。 

(9) 由 于 结 点 9 是 叶子 结 点 ,同时 结 点 9 的 目标 函数 值 是 表 PT 中 的 极 大 值 , 所 以 , 结 点 
9 对 应 的 解 即 是 问题 的 最 优 解 ,搜索 结束 。 

假设 求解 最 大 化 问题 , 解 向 量 为 和 二 (zi1 ,zs,…,z,), 其 中 ,zx; 的 取 值 范围 为 某 个 有 穷 
集合 5S; ,15;|==r; (1 全 in)。 在 使 用 分 支 限 界 算法 搜索 问题 的 解 空间 树 时 ,首先 根据 限界 
函数 估算 目标 函数 的 界 Ldown,upj, 然 后 从 根 结 点 出 发 ,扩展 根 结 点 的 六 个 孩子 结 点 ,从 而 
构成 分 量 xz, 的 x 种 可 能 的 取 值 方式 。 对 这 个 孩子 结 点 分 别 估算 可 能 取得 的 目标 函数 值 
bound(zi ) ,其 含义 是 以 该 孩子 结 点 为 根 的 子 树 所 可 能 取得 的 目标 函数 值 不 大 于 bound(z )， 
也 就 是 部 分 解 应 满足 : 
bound(zx1) 之 bound(z1,72) 过 … 过 bound(ziyze，…zk) 之 … 过 boundCziy ze，…Zn) 

若 某 孩 子 结 点 的 目标 函数 值 超出 目标 函数 的 界 , 则 将 该 孩子 结 点 丢弃 ; 否则 ,将 该 孩子 
结 点 保存 在 待 处 理 结 点 表 PT 中 。 从 表 PT 中 选取 使 目标 函数 取得 极 大 值 的 结 点 作为 下 一 
次 扩展 的 根 结 点 ,重复 上 述 过 程 , 当 到 达 一 个 叶子 结 点 时 ,就 得 到 了 一 个 可 行 解 生 = (x1， 
zi,…,zn) 及 甚 目标 函数 值 boundCzi ,zzv)。 

如 果 bound(Czi ,zs*,…':'zw) 是 表 PT 中 目标 函数 值 最 大 的 结 点 , 则 boundCzi zs，…， 
zw) 就 是 所 求 问题 的 最 大 值 , (zi ,xs,… ,x, ) 就 是 问题 的 最 优 解 。 

如 果 bound(Czri ,zs,…,zw) 不 是 表 PT 中 目标 函数 值 最 大 的 结 点 ,说 明 还 存在 某 个 部 分 
解 对 应 的 结 点 ,其 上 界 大 于 bound(zi ,zs*.…,z,)。 于 是 .用 bound(Czi ,zs*.…,zv) 调 整 目 
标 函 数 的 下 界 , 即 令 down 王 bound(Czi ,zs.…,zv) .并 将 表 PT 中 超出 目标 函数 下 界 down 
的 结 点 删除 ,然后 选取 目标 函数 值 取得 极 大 值 的 结 点 作为 下 一 次 扩展 的 根 结 点 ,继续 搜索 ， 
直到 某 个 叶子 结 点 的 目标 函数 值 在 表 PT 中 最 大 。 
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9.6.2 分 支 限 界 算法 设计 


分 支 限 界 算法 求解 最 大 化 问题 的 一 般 过 程 如 下 。 

(1) 根据 限界 函数 确定 目标 函数 的 界 [down,upj]。 

(2) 将 待 处 理 结 点 表 PT 初始 化 为 空 。 

(3) 对 根 结 点 的 每 个 孩子 结 点 x 执行 下 列 操作 。 

Oa 估算 结 点 工 的 目标 函数 值 value。 

@ 若 value 宇 down, 则 将 结 点 x 加 入 表 PT 中 。 

(4) 循环 直到 某 个 叶子 结 点 的 目标 函数 值 在 表 PT 中 最 大 。 

Q@ i= 表 PT 中 值 最 大 的 结 点 。 

@ 对 结 点 i 的 每 个 孩子 结 点 x 执行 下 列 操作 。 

a. 估算 结 点 xz 的 目标 函数 值 value。 

b. 若 value 宇 down, 则 将 结 点 xz 加 入 表 PT 中 ; 

c. 若 结 点 x 是 叶子 结 点 且 结 点 x 的 value 值 在 表 PT 中 最 大 , 则 将 结 点 x 对 应 的 解 输 
出 ,算法 结束 。 

d. 若 结 点 x 是 叶子 结 点 但 结 点 x 的 value 值 在 表 PT 中 不 是 最 大 , 则 令 down== value， 
并 且 将 表 PT 中 所 有 小 于 value 的 结 点 删除 。 

应 用 分 支 限 界 算法 的 关键 问题 如 下 。 

(1) 如 何 确定 合适 的 限界 函数 ; 

(2) 如 何 组 织 待 处 理 结 点 表 ; 

(3) 如 何 确定 最 优 解 中 的 各 个 分 量 。 

分 支 限界 算 法 对 问题 的 解 空间 树 中 结 点 的 处 理 是 跳跃 式 的 ,回溯 也 不 是 单纯 地 沿 着 双 
亲 结 点 一 层 一 层 向 上 回溯 ,因此 , 当 搜 索 到 某 个 叶子 结 点 且 该 叶子 结 点 的 目标 函数 值 在 表 
PT 中 最 大 时 (假设 求解 最 大 化 问题 ) , 求 得 问题 的 最 优 值 , 但 是 , 却 无 法 求 得 该 叶子 结 点 对 
应 的 最 优 解 中 的 各 个 分 量 。 这 个 问题 可 以 用 如 下 方法 解决 : 

Q@ 对 每 个 扩展 结 点 保存 该 结 点 到 根 结 点 的 路 径 ; 

@ 在 搜索 过 程 中 构建 搜索 经 过 的 树 结 构 ,在 求 得 最 优 解 时 ,从 叶子 结 点 不 断 回溯 到 根 
结 点 ,以 确定 最 优 解 中 的 各 个 分 量 。 

对 于 方法 ,针对 图 9. 15 所 示 的 0/1 背包 问题 ,为 了 对 每 个 扩展 结 点 保存 该 结 点 到 根 
结 点 的 路 径 , 将 部 分 解 (x1 ,zs,…',zi) 和 该 部 分 解 的 目标 函数 值 都 存储 在 待 处 理 结 点 表 PT 
中 ,在 搜索 过 程 中 表 PT 的 状态 如 图 9. 16 所 示 。 


(1)76 (0)60 | (0)60 (1.0)70 

(a) 扩展 根 结 点 后 表 PT 状态 (b) 扩展 结 点 2 后 表 PT 状态 

(0)60 (1.0.1)69 “| (1.0.0)64 | (0)60 (1.0.0)64 | (1,0,1,0)65 
(©) 扩展 结 点 5 后 表 PT 状 态 (d) 扩展 结 点 6 后 表 PT 状 态 ， 最 优 解 为 (1,0,1,0)65 


图 9.16 方法 四 确定 0/1 背包 问题 最 优 解 探索 过 程 中 表 PT 的 状态 
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对 于 方法 四 ,针对 图 9. 15 所 示 的 0/1 背包 问题 ,为 了 在 搜索 过 程 中 构建 搜索 经 过 的 树 
结构 , 设 一 个 表 ST, 在 表 PT 中 取出 最 大 值 结 点 进行 扩充 时 ,将 最 大 值 结 点 存储 到 表 ST 中 ， 
表 PT 和 表 ST 的 数据 结构 为 (物品 i 一 1 的 选择 结果 ,< 物品 i, 物品 i 的 选择 结果 > ub) ,在 
搜索 过 程 中 表 PT 和 表 ST 的 状态 如 图 9. 17 所 示 。 


PT | (0,<1,1>76) | (0,<1,0>60) PT | (0,<1,0>60) | (1.<2.0>70) 
ST ST | (0,<1,1>76) 
(a) 扩展 根 结 点 后 (b) 扩展 结 点 2 后 
PT | (0,<1,0>60) | (0,<3,1>69) | (0,<3,0>64) PT | (0,<1,0>60) | (0,<3.0>64) | (1,<4,0>65) 
ST| (0,<1,1>76) | (1,<2,0>70) ST| (0,<1,1>76) | (1,<2,0>70) | (0.<3,1>69) 
(ec) 扩展 结 点 5 后 (d) 扩展 结 点 6 后， 最 优 解 为 (1,0,1,0)65 


图 9.17 方法 @ 确 定 0/1 背包 问题 最 优 解 搜索 过 程 中 表 PT 和 表 ST 的 状态 


9.6.3 分 支 限 界 算 法 应 用 实例 一 一 任务 分 配 问题 


任务 分 配 问题 要 求 把 ”项 任务 分 配给 ”个 人 ,每 个 人 完成 每 项 任务 的 成 本 不 同 ,要 求 
分 配 总 成 本 最 小 的 最 优 分 本 方案。 图 9. 18 所 示 是 一 个 任 任务 | 任务 2 任 多 3 任 和 4 


务 分 配 的 成 本 矩阵。 9 2 7 8 Auc 
求 最 优 分 配 成 本 的 上 界 和 下 界 。 cs 4 3 7| ARe 
考虑 任意 一 个 可 行 解 ,例如 矩阵 中 的 对 角 线 是 一 个 合 | 。 ， ， 人 

法 的 选择 ,表示 将 任务 1 分 配给 人 员 a ,任务 2 分 配给 人 

任务 分 配 问题 的 成 本 矩阵 


员 b、 任 务 3 分 配给 人 员 c、 任 务 4 分 配给 人 员 d, 其 成 本 图 ”18 
是 9 十 4 十 1 十 4 一 18; 或 者 应 用 贪心 算法 求 得 一 个 近似 解 : 
将 任务 2 分 配给 人 员 a 任务 3 分 配给 人 员 2、 任 务 1 分 配给 人 员 c、 任 务 4 分 配给 人 员 cd ,其 
成 本 是 2 十 3 十 5 十 4 二 14。 显 然 ,14 是 一 个 更 好 的 上 界 。 为 了 获得 下 界 , 考 虑 人 员 a 执行 所 
有 任务 的 最 小 代价 是 2, 人 员 2 执行 所 有 任务 的 最 小 代价 是 3, 人 员 c 执行 所 有 任务 的 最 小 
代价 是 1, 人 员 d 执行 所 有 任务 的 最 小 代价 是 4。 因此 ,将 每 一 行 的 最 小 元 素 加 起 来 就 得 到 
解 的 下 界 , 其 成 本 是 2 十 3 十 1 十 4 二 10。 需 要 强调 的 是 ,这 个 解 并 不 是 一 个 合法 的 选择 (3 和 
1 来 自 于 矩阵 的 同一 列 ) , 它 仅 仅 给 出 了 一 个 参考 下 界 , 这 样 ,最 优 值 一 定 是 10 一 14 的 某 
个 值 。 
设 当前 已 对 人 员 1~i 分 配 了 任务 .并 且 获 得 了 成 本 v, 则 限界 函数 可 以 定义 为 式 (9. 10) ， 
lb 一 uv 十 六 第 行 的 最 小 值 (9.10) 


应 用 分 支 限 界 算法 求解 图 9. 18 所 示 任 务 分 配 问 题 , 对 解 空间 树 的 搜索 如 图 9. 19 所 示 ， 
具体 的 搜索 过 程 如 下 ( 见 图 9. 20) 。 
(1) 在 根 结 点 1. 没 有 分 配 任务 ,根据 限界 函数 估算 目标 函数 值 为 2 十 3 十 1 十 4 一 10。 

(2) 在 结 点 2, 将 任务 1 分 配给 人 员 a ,获得 的 成 本 为 9, 目标 函数 值 为 9 十 (3 十 1 十 4) 一 17， 
超出 目标 函数 的 界 L[10,14] ,将 结 点 2 丢弃 ; 在 结 点 3, 将 任务 2 分 配给 人 员 a ,获得 的 成 本 
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PT| (0,<2, a>10) PT | (2,<1, b>13) | (2,<3, b>10) | (2,<4. b>14) 
sT | sT [0.2.0210) 
(a) 扩展 根 结 点 后 的 状态 (b) 扩展 结 点 3 后 的 状态 
PT[ @<D 6513) | C4 DT G<lceI | PT [G4 01 TG.<1, 1 T0313) 
ST | (0,<2, a>10) | (2,<3, b>10) | ST | (0,<2, a>10) | (2,<3, b>10) | (2,<1, b>13) 
(ce) 扩展 结 点 7 后 的 状态 (d) 扩展 结 点 6 后 的 状态 
PT| (2,<4, b>14) | (3,<1, c>14) | (3,<4, 13) ST | (0,<2, a>10) | (2.<3, b>10) | (2,<1, b>13) | (1,<3, c>13) 


(e) 扩展 结 点 11 后 的 状态 ， 最 优 解 为 2>a, 1 一 b, 3 一 c, 4 一 4d 
图 9.19 任务 分 配 问题 最 优 解 的 确定 


为 2, 目标 函数 值 为 2 十 (3 十 1 十 4) 王 10, 将 结 点 3 加 入 待 处理 结 点 表 PT 中 ; 在 结 点 4, 将 任 
务 3 分 配给 人 员 a ,获得 的 成 本 为 7, 目标 函数 值 为 7 十 (3 十 1 十 4) 王 15, 超 出 目标 函数 的 界 
[10,14] ,将 结 点 4 丢弃 ; 在 结 点 5, 将 任务 4 分 配给 人 员 a ,获得 的 成 本 为 8, 目 标 函 数值 为 
8 十 (3 十 1 十 4) 王 16 ,超出 目标 函数 的 界 [10,14] ,将 结 点 5 丢弃 。 


Start 
lb=10 
Fr 3 4 x $9. 
I>a 2 一 a 3 一 a 4 一 0 
lb=17 lb=10 lb=15 lb=16 
6 7 8 
1—b 3—b 4 一 0 
lb=13 lb=10 lb=14 | 
1 / x 9 1 x 
1 3 一 c 2 4 一 c 1 一 c 4 一 c 
lb=13 lb=17 Ib=14 lb=17 
1 
Ep 
lb=13 


图 9.20 分 支 限 界 算法 求解 任务 分 配 问题 示例 (X 表 示 该 结 点 被 丢弃 , 结 点 上 方 的 数组 表示 搜索 顺序 


(3) 在 表 PT 中 选取 目标 函数 值 极 小 的 结 点 3 优先 进行 搜索 。 

(4) 在 结 点 6, 将 任务 1 分 配给 人 员 5 ,获得 的 成 本 为 2 十 6 一 8, 目 标 函 数值 为 8 十 (1 十 
4) 二 13, 将 结 点 6 加 入 表 PT 中 ; 在 结 点 7, 将 任务 3 分 配给 人 员 5 ,获得 的 成 本 为 2 十 3 一 5， 
目标 函数 值 为 5 十 (1 十 4) 一 10, 将 结 点 7 加 入 表 PT 中 ; 在 结 点 8, 将 任务 4 分 配给 人 员 10， 
获得 的 成 本 为 2 十 7 一 9, 目 标 函 数值 为 9 十 (1 十 4) 王 14, 将 结 点 8 加 入 表 PT 中。 

(5) 在 表 PT 中 选取 目标 函数 值 极 小 的 结 点 7 优先 进行 搜索 。 
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(6) 在 结 点 9, 将 任务 1 分 配给 人 员 c ,获得 的 成 本 为 5 十 5 二 10, 目 标 函 数值 为 10 十 4 一 
14, 将 结 点 9 加 入 表 PT 中 ; 在 结 点 10, 将 任务 4 分 配给 人 员 c ,获得 的 成 本 为 5 十 8 二 13, 目 
标 函 数值 为 13 十 4 王 17 ,超出 目标 函数 的 界 [10,14] ,将 结 点 10 丢弃 。 

(7) 在 表 PT 中 选取 目标 函数 值 极 小 的 结 点 6 优先 进行 搜索 。 

(8) 在 结 点 11 ,将 任务 3 分 配给 人 员 c ,获得 的 成 本 为 8 十 1 二 9, 目 标 函 数值 为 9 十 4 一 
13 ,将 结 点 11 加 入 表 PT 中 ; 在 结 点 12, 将 任务 4 分 配给 人 员 c ,获得 的 成 本 为 8 十 8 一 16， 
目标 函数 值 为 16 十 4 一 20, 超 出 目标 函数 的 界 [10,14] ,将 结 点 12 丢弃 。 

(9) 在 表 PT 中 选取 目标 函数 值 极 小 的 结 点 11 优先 进行 搜索 。 

(10) 在 结 点 13 ,将 任务 4 分 配给 人 员 d ,获得 的 成 本 为 9 十 4 王 13 ,目标 函数 值 为 13 ,由 
于 结 点 13 是 叶子 结 点 ,同时 结 点 13 的 目标 函数 值 是 表 PT 中 的 极 小 值 ,所 以 , 结 点 13 对 应 
的 解 即 是 问题 的 最 优 解 ,搜索 结束 。 

为 了 在 搜索 过 程 中 构建 搜索 经 过 的 树 结构 , 设 一 个 表 ST, 在 表 PT 中 取出 最 大 值 结 点 
进行 扩充 时 ,将 最 大 值 结 点 存储 到 表 ST 中 , 表 PT 和 表 ST 的 数据 结构 为 (人 员 i 一 1 分 配 
的 任务 ,< 任务 ,人 员 i > lb) 。 

回溯 过 程 是 : (3,(4,d)13) 一 (1,(3,c)13) 一 (2,(1,6)13) 一 (0,(2,a)10)。 

算法 9.11 任务 分 配 问题 的 分 支 限 界 算法 。 

(1) 根据 限界 函数 计算 目标 函数 的 下 界 down; 采用 贪心 算法 得 到 上 界 up; 

(2) 将 待 处 理 结 点 表 PT 初始 化 为 空 ; 

(3) for(i=1; i<=n; i++) 

x[i]=0; 
(4) k=1; i=0; // 为 第 k 个 人 分 配 任务 ,i 为 第 k- 1 个 人 分 配 的 任务 
(5) while(k >=1) 
© x[k] =1; 
©@ while(x[k]<=n) 
a. 如 果 人 员 k 分 配 任务 x[k] 不 发 生 冲 突 , 则 
根据 式 (9. 10) 计 算 目标 函数 值 lb; 
车 lb<= up, 则 将 i,<x[k], k> lb 存储 在 表 PT 中; 
b. x[k] =x[k] +1; 
@@ 如 果 k==n 且 叶子 结 点 的 1b 值 在 表 PT 中 最 小 ， 
则 输出 该 叶子 结 点 对 应 的 最 优 解 ; 
@ 否则 ,如 果 k==n 且 表 PT 中 的 叶子 结 点 的 1b 值 不 是 最 小 , 则 
a. up= 表 PT 中 的 叶子 结 点 最 小 的 1b 值 ; 
b. 将 表 PT 中 超出 目标 函数 界 的 结 点 删除 ; 
@ i= 表 PT 中 1b 最 小 的 结 点 的 x[k] 值 ; 
@Kk= 表 PT 中 1b 最 小 的 结 点 的 k 值 ; k++; 


回 题 9 


1. 简 述 分 治 算法 和 动态 规划 算法 的 联系 和 区 别 。 

2. 简 述 回溯 算法 和 分 支 限界 算法 的 相同 点 和 不 同 点 。 

3. 试用 分 治 算法 实现 有 重复 元 素 的 排列 问题 : 设 尽 ={r~i,r:,…:rs} 是 要 进行 排列 的 
7 个 元 素 , 其 中 元 素 7 ,r,,…,r, 可 能 相同 , 试 编程 实现 计算 R 的 所 有 不 同 排列 。 
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4. 分 别 用 贪心 算法 ,动态 规划 算法 、 回 溯 算 法 设计 0/1 背包 问题 。 要求: 说 明 所 使 用 的 
算法 策略 ; 写 出 算法 实现 的 主要 步骤 ; 分 析 算 法 的 时 间 。 

5. 试用 贪心 算法 求解 下 列 问 题 : 将 正 整 数 分 解 为 若干 个 互 不 相同 的 自然 数 之 和 ,使 
这 些 自然 数 的 乘积 最 大 。 

6. 试用 蛮 力 算法 实现 字符 串 匹 配 问题 。 


仁 机 练习 9 


1. 设计 一 个 递归 算法 生成 ”个 元 素 的 全 排列 。 

2. 给 定 2 个 序列 X={ziyzr,…,zn} 和 Y={yivyz,…,yv} ,编程 应 用 动态 规划 算法 
找 出 X 和 YY 的 最 长 公共 子 序列 。 

3. 编程 应 用 贪心 算法 求解 活动 安排 问题 。 设 及 个 活动 的 集合 EE 二 {1,2,…,n), 其 中 
每 个 活动 都 要 求 使 用 同一 资源 ,而 在 同一 时 间 内 只 有 一 个 活动 能 使 用 这 一 资源 。 活 动 安排 
问题 就 是 要 在 所 给 的 活动 集合 中 选 出 最 大 ( 尽 可 能 多 ) 的 相 容 活动 子 集合 。 

4. 请 用 回溯 算法 求解 n 皇后 问题 。n 皇后 问题 是 一 个 古老 而 著名 的 问题 ,是 回溯 算法 
的 典型 例题 。 在 n * n 格 的 棋盘 上 摆 放 个 皇后 ,使 其 不 能 互相 攻击 , 即 任意 两 个 皇后 都 不 
能 处 于 同一 行 、 同 一 列 或 同一 斜 线 上 ,有 多 少 种 摆 法 ? 
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本 章 学 习 要 点 

(1) 了 解 自 定 义 类 模板 与 STL 使 用 的 区 别 ; 

(2) 理解 STL 的 容器 .迭代 器 和 算法 的 作用 和 应 用 方法 ; 

(3) 理解 利用 STL 解决 实际 应 用 的 方法 。 

标准 模板 库 (Standard Template Library,STL) 是 标准 C++ 标准 库 的 一 部 分 。STL 的 
源 代 码 涉及 数据 结构 和 算法 的 许多 具体 实现 ,可 以 充当 经 典 的 数据 结构 和 算法 教材 ,同时 ， 
在 实际 应 用 中 ,程序 员 常 常 利用 STL 提供 的 完善 的 数据 结构 和 算法 来 编程 ,避免 重复 劳动 ， 
节省 大 量 的 时 间 和 精力 ,以 得 到 更 高 质量 的 代码 。 


(i0,1 STL 简介 


STL 是 标准 C++ 标准 库 的 一 部 分 ,不 需 额 外 安装 。STL 的 代码 从 广义 上 讲 分 为 三 类 : 
算法 (algorithm) ,容器 (container) 和 和 迭代 器 (iterator)。 几 乎 所 有 的 代码 都 采用 了 模板 类 和 
模板 函数 的 方式 ,这 相 比 于 传统 的 由 函数 和 类 组 成 的 库 来 说 提供 了 更 好 的 代码 重用 机 会 。 
本 节 只 对 它们 进行 简要 的 介绍 ,详细 信息 可 从 C++ 联机 文件 中 查找 。 


10.1.1 容器 


在 实际 的 开发 过 程 中 ,数据 结构 本 身 的 重要 性 不 会 逊 于 操作 于 数据 结构 的 算法 的 重要 
性 , 当 程序 中 存在 着 对 时 间 要 求 很 高 的 部 分 时 ,数据 结构 的 选择 就 显得 更 加 重要 。 

经 典 的 数据 结构 数量 有 限 ,但 是 程序 员 常 常 重复 着 一 些 为 了 实现 向 量 、 链 表 等 结构 而 编 
写 的 代码 ,这 些 代码 都 十 分 相似 ,只 是 为 了 适应 不 同 数据 的 变化 而 在 细节 上 有 所 出 入 。STL 
容器 就 提供 了 这 样 的 方便 : 它 允 许 重复 利用 已 有 的 实现 而 构造 自己 的 特定 类 型 下 的 数据 结 
构 ; 通过 设置 一 些 模板 类 , 它 对 最 常用 的 数据 结构 提供 了 支持 ,这 些 模 板 的 参数 允许 指定 容 
器 中 元 素 的 数据 类 型 ,可 以 将 许多 重复 而 乏味 的 工作 简化 。 

容器 是 数据 结构 ,是 包含 对 象 的 对 象 。 例 如 ,数组 .队列 .堆栈 、 树 、 图 等 数据 结构 中 的 每 
一 个 结 点 都 是 对 象 。 这 些 结构 按 某 种 特定 的 逻辑 关系 把 数据 对 象 (数据 元 素 ) 组 装 起 来 , 进 
而 成 为 一 个 新 的 对 象 。 如 果 抽象 了 数据 元 素 的 具体 实现 ,只 关心 结构 的 组 织 和 算法 ,就 是 类 
模板 了 。STL 提供 的 容器 是 常用 数据 结构 的 类 模板 。 


1. 容器 的 分 类 


STL 容器 类 库 包 含 7 种 基本 容器 : 
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向 量 (vector)、 双 队列 (deque)、 列 表 (list)、 集 合 


(set) ,多 重 集合 (multiset) ,映射 (map) ,多重 映射 (multimap)。 基 本 容器 可 以 分 成 两 组 : 顺 
序 容器 和 关联 容器 ,在 使 用 前 必须 包含 相应 的 头 文件 。 表 10. 1 对 7 种 基本 容器 进行 了 简要 


介绍 。 
表 10.1 7 种 基本 容器 
容 器 类 型 头 文件 描 述 
向 量 顺序 容器 vector 按 需 要 伸缩 的 数组 
双 队 列 顺序 容器 deque 两 端 进行 有 效 插入 、 删 除 的 数组 
列表 顺序 容器 list 双向 链表 ,可 以 从 任意 一 端 开始 遍历 ,但 需要 按 顺 序 访 
问 容器 

合 关联 容器 set 不 含 重复 键 的 集合 
多 重 集合 关联 容器 Set 含 重复 键 的 集合 
映射 关联 容器 map 用 键 访问 的 不 含 重复 键 的 映像 
多 重 映射 关联 容器 map 允许 重复 键 的 映像 
2. 容器 的 接口 


STL 经 过 精心 设计 ,使 容器 提供 类 似 的 功能 。 许 多 一 般 化 的 操作 对 所 有 容器 都 适用 ， 
也 有 些 操 作 是 为 某 些 容器 特别 设 定 的。 只 有 了 解 成 员 函 数 的 原型 才能 正确 地 使 用 STL 编 
程 。 这 里 以 向 量 模板 vector 为 例 , 介 绍 主要 的 函数 原型 。 

vector 用 类 似 数组 表示 法 表达 线性 表 的 对 象 ,是 最 常用 的 容器 。 表 10. 2 给 出 了 vector 
的 常用 成 员 函 数 说 明 ,其 中 用 到 的 一 些 标识 符 的 含义 如 下 : 


。 size_type: 无 符号 整数 。 


。 iterator: 随机 访问 的 迭代 。 和 迭代 式 对 象 版 本 的 指针 。 
。 reference: 可 以 转换 为 T& 的 类 型 。 


表 10.2 vector 的 常用 成 员 函 数 说 明 


成 员 函 数 原型 


功能 描述 


vector(); 
vector(const T &V); 


vector(size_type n,const T &val=T()); 


~ vector(); 
reference at(int iD 
reference back(); 
iterator begin(); 
void clear(); 

bool empty(C)const; 


iterator end(); 


默认 构造 函数 ,创建 一 个 长 度 为 0 的 向 量 

复制 构造 函数 ,创建 一 个 V 的 副本 

构造 函数 ,创建 一 个 长 度 为 n 的 向 量 ,每 一 个 元 素 初始 化 
为 val 

析 构 函数 ,释放 向 量 的 动态 内 存 

如 果 i 是 有 效 索 引 ,返回 第 i 个 元 素 的 引用 ,否则 报错 
返回 向 量 中 的 最 后 一 个 元 素 的 引用 

返回 向 量 中 的 第 一 个 元 素 的 迭代 
删除 向 量 的 所 有 元 素 

如 果 向 量 中 没有 元 素 , 返 回 true, 否 则 返回 false 

返回 向 量 中 的 最 后 一 个 元 素 的 迭代 
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续 表 

成 员 函 数 原型 功能 描述 

iterator erase(iterator pos); 删除 向 量 中 的 pos 位 的 元 素 ,返回 在 被 删除 的 元 素 之 前 
出 现 的 元 素 的 位 置 
reference front(); 返回 向 量 中 的 第 一 个 元 素 的 引用 
iterator insert(iterator pos,const T &val 二 T()); 在 向 量 pos 位 置 插入 val 的 副本 ,返回 插入 位 置 
vector< 工 > &operator 一 (const vector<T> &V); 把 V 赋 给 向 量 , 返 回 修改 后 的 向 量 
reference operator[ |](size_type )); 返回 向 量 中 的 第 i 个 元 素 的 引用 
void pop_back(); 删除 向 量 中 的 最 后 一 个 元 素 
void push_back(const T B&.val); 在 向 量 中 的 最 后 一 个 元 素 之 后 插入 val 的 副本 
reverse_iterator rbegin(); 返回 向 量 中 的 第 一 个 元 素 的 反 向 迭代 ,指向 最 后 一 个 元 素 
reverse_iterator rend(); 返回 向 量 中 的 最 后 一 个 元 素 的 反 向 和 迭代 ,指向 第 一 个 元 素 
void resize(size_type s,T val=T()); 重 置 向 量 长 度 
Size_type size()const; 返回 向 量 中 元 素 的 个 数 
void swap(vector < T> B&V); 当前 向 量 与 向 量 V 交换 
3. 顺序 容器 


顺序 容器 将 一 组 具有 相同 类 型 的 元 素 以 严格 的 线性 形式 组 织 起 来 。 顺 序 容 器 可 分 为 
向 量 (vector) 、 双 队列 (deque) ,列表 (list)3 种 类 型 ,这 3 种 顺序 容器 在 某 些 方面 是 极其 相 
似 的 。 例 如 ,都 有 用 于 增加 元 素 的 insert 成 员 函 数 ,以 及 用 于 删除 元 素 的 erase 成 员 函 数 ， 
并 且 3 种 顺序 容器 的 元 素 均 可 通过 位 置 来 访问 。 但 这 3 种 容器 又 具有 各 自 不 同 的 特点 。 
例如 ,vector 和 deque 都 重 载 了 操作 符 “[]”, 而 list 则 没有 ,因此 list 容器 是 不 支持 随机 访 
间 的 , 除 operator[] 和 at() 函 数 外 ,list 提供 vector 的 其 余 功能 。 另 外 ,list 容器 还 提供 成 员 
函数 splice() 和 merge() 合 并 列表 、sort() 排 列 、push_front() 和 pop_front() 追 加 与 删除 列 
表 元 素 。deque 容器 就 像 vector 和 list 的 混合 体 , 既 支持 vector 的 行为 ,也 支持 list 的 
行为 。 

这 3 种 容器 中 最 主要 的 区 别 是 在 时 间 和 存储 效率 上 不 同 。STL 公布 了 在 不 同 容器 上 
各 种 标准 操作 的 效率 ,从 而 可 以 根据 实际 情况 来 决定 使 用 哪 种 容器 。 例 如 ,如 果 应 用 程序 要 
在 头 部 和 尾部 插入 元 素 ,出 于 效率 上 的 考虑 ,应 该 选择 deque 而 非 vector。 表 10. 3 总 结 了 
在 这 3 种 顺序 容器 上 标准 操作 的 效率 。 


表 10.3 顺序 容器 上 标准 操作 的 效率 


操 作 vector deque list 
在 头 部 插入 或 删除 元 素 线性 恒定 恒定 
在 尾部 插入 或 删除 元 素 恒定 恒定 恒定 
在 中 间 插 入 或 删除 元 素 线性 线性 恒定 
访问 头 部 的 元 素 恒定 恒定 恒定 


访问 尾部 的 元 素 恒定 恒定 恒定 
访问 中 间 的 元 素 恒定 恒定 线性 
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4. 关联 容器 


关联 容器 具有 根据 一 组 索引 来 快速 提取 元 素 的 能 力 ,其 中 元 素 可 以 通过 键 值 ( 关 键 字 ， 
key) 来 访问 。4 种 关联 容器 可 以 分 成 两 组 : set 和 map。 

(1) set 是 一 种 集合 ,其 中 可 包含 0 个 或 多 个 不 重复 的 以 及 没 排序 的 元 素 , 这 些 元 素 被 
称 为 键 值 。 例 如 ,set 集合 S15, 一 100,200} 中 包含 3 个 键 值 。 与 例 10. 1 中 的 nums 不 同 ， 
不 能 通过 下 标 来 访问 集合 S 。 

(2) map 是 一 种 映像 ,其 中 可 包含 0 个 或 多 个 元 素 对 ,一 个 元 素 是 不 重复 的 键 值 , 另 一 
个 是 与 键 值 相 关联 的 值 。 例 如 : map 映像 m{ (first,5), (second, 一 100), (third,200)} 中 包 
含 3 对 元 素 。 每 对 元 素 都 由 一 个 键 值 和 相关 联 的 值 构 成 。 

multiset 是 允许 有 重复 键 值 的 set, 而 multimap 是 容许 有 重复 键 值 的 map。 

map 和 multimap 容器 的 元 素 是 按 关键 字 顺 序 排 列 的 ,因此 提供 按 关键 字 快 速 查找 元 
素 。 重 载运 算 符 函数 operator[ ] 基 于 关键 字 进 行 访问 。 成 员 函 数 find()、count()、lower_ 
bound() 和 upper_bound() 基 于 元 素 键 值 进行 查找 和 计数 。 

set、multiset 与 map 和 multimap 很 相似 。 区 别 仅 是 set、multiset 不 支持 下 标 操作 。 

例 10.1 以 vector 容器 为 例 , 说 明 容器 的 使 用 。 

例 10.1 示例 STL 容器 的 使 用 。 


# include < iostream> 
# include < vector > // 包 含 向 量 容器 头 文件 
using namespace std; 
int main() 
{ 
int i; 
vector < int > nums; // 整 型 向 量 ,长 度 为 0 
nums. insert (nums. begin(), ~ 100); 
nums. insert (nums. begin( ), 5); 
nums. insert (nunms. end( ), 200); 
for (i=0;i<nums. size();i+t+) 
cout << nums[i]<<" "; 
cout << endl; 
nums. erase( nums. begin( )); 
nums. erase(nums. begin( )); 
for (i=0;i<nunms. size();i+t+) 
cout << nums[ i]<<" "; 
cout << endl; 
return 0; 


} 
程序 输出 结果 为 : 


5 —100 200 
200 


程序 分 析 : 
(1) vector 支持 在 两 端 插入 元 素 ,并 提供 begin() 和 end() 成 员 函 数 ,分 别 用 来 访问 头 部 
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和 尾部 元 素 。 
(2) 如 果 容 器 不 为 空 ,成 员 函 数 begin() 的 返回 值 指向 容器 的 第 一 个 元 素 , 否则 指向 容 
器 尾部 之 后 的 位 置 ; 而 成 员 函 数 end() 的 返回 值 仅 指向 容器 尾部 之 后 的 位 置 。 所 以 插入 3 
个 数 的 顺序 为 5、 一 100、200, 因 此 第 一 次 输出 向 量 中 所 有 元 素 为 5、 一 100、200。 

(3) 同 理 , 删 除 2 个 数 的 顺序 为 5、 一 100, 所 以 第 2 次 输出 向 量 中 所 有 元 素 为 200。 


10.1.2 和 迭代 器 


简单 地 说 ,迭代 器 是 面向 对 象 版 本 的 指针 , 它 提供 了 访问 容器 和 序列 中 每 个 元 素 的 方 
法 ,因此 ,STL 利用 迭代 器 对 存储 在 容器 中 的 元 素 序列 进行 壳 历 。 

虽然 指针 也 是 一 种 迭代 器 ,但 迭代 器 却 不 仅仅 是 指针 。 指 针 可 以 指向 内 存 中 的 一 个 地 
址 ,然后 通过 这 个 地 址 访问 相应 的 内 存单 元 。 而 迭代 器 更 为 抽象 , 它 可 以 指向 容器 中 的 一 个 
位 置 ,然后 就 可 以 直接 访问 这 个 位 置 的 元 素 。 

软件 设计 有 一 个 基本 原则 一 一 所 有 的 问题 都 可 以 通过 引进 一 个 间接 层 来 简化 。 这 种 简 
化 在 STL 中 就 是 用 迭代 器 来 完成 的 。 概 括 来 说 ,迭代 器 在 STL 中 用 来 将 算法 和 容器 联系 
起 来 ,起 着 “中 间 人 ”的 作用 。 如 前 面 章 节 所 述 ,遍历 链表 需要 使 用 指针 ,对 数组 元 素 进行 排 
序 需要 通过 下 标 来 访问 数组 元 素 。 这 时 ,指针 和 下 标 运算 符 便 充当 了 算法 和 数据 结构 的 “中 
间 人 ”。 在 STL 中 ,容器 是 封装 起 来 的 类 模板 ,其 内 部 结构 无 从 知晓 ,只 能 通过 容器 接口 来 
使 用 容器 。 但 仅 依靠 容器 接口 不 能 对 元 素 进 行 灵活 的 访问 。 况 且 STL 中 的 算法 是 通用 的 
函数 模板 ,并 不 是 专门 针对 哪 一 个 容器 类 型 的 。 算 法 要 适用 于 多 种 容器 ,而 每 一 种 容器 中 存 
放 的 元 素 又 可 以 是 任意 类 型 ,如 何 用 普通 的 指针 或 下 标 来 充当 中 介 呢 ? 使 用 指针 需要 知道 
其 指向 的 元 素 类 型 ,使 用 下 标 需要 在 相应 的 容器 中 定义 过 下 标 操作 符 ,而 并 不 是 每 个 容器 中 
都 有 下 标 操 作 符 的 。 这 时 就 必须 使 用 更 为 抽象 的 “指针 ”一 一 迭代 器 。 就 像 声明 指针 时 要 说 
明 其 指向 的 元 素 一 样 ,STL 的 每 一 个 容器 类 模板 中 ,都 定义 了 其 本 身 所 专 有 的 迭代 器 ,不 同 
的 容器 可 能 需要 不 同 的 欠 代 器 。 使 用 迭代 器 ,算法 函数 可 以 访问 容器 中 指定 位 置 的 元 素 , 而 
无 须 关心 元 素 的 具体 类 型 。 


1. 迭代 器 的 分 类 


根据 迭代 器 所 支持 的 操作 不 同 ,在 STL 中 定义 了 5 种 迭代 器 ,它们 是 输入 迭代 器 
(input iterator) ,输出 迭代 器 (output iterator) ,前 向 迭代 器 (forward iterator, 又 称 正 向 迭代 
器 )、 双 向 迭代 器 (bidirectional iterator) ,随机 访问 迭代 器 (randomaccess iterator) 。 

1) 输入 迭代 器 

输入 迭代 器 用 于 读 取 容器 中 的 信息 ,但 不 一 定 能 够 修改 它 。 输 入 迭代 器 iter 通过 解除 
引用 ( 即 * iter) ,来 读 取 容器 中 其 所 指向 元 素 之 值 ; 为 了 使 输入 迭代 器 能 够 访问 容器 中 的 所 
有 元 素 的 值 ,必须 使 其 支持 (前 /后 缀 格式 的 ) 十 十 操作 符 ; 输入 迭代 器 不 能 保证 第 二 次 遍历 
容器 时 顺序 不 变 , 也 不 能 保证 其 递增 后 先前 指向 的 值 不 变 。 即 基于 输入 迭代 器 的 任何 算法 ， 
都 应 该 是 单 通 的 ,不 依赖 于 前 一 次 遍历 时 的 值 , 也 不 依赖 于 本 次 遍历 中 前 面 的 值 。 可 见 输入 
迭代 器 是 一 种 单 向 的 只 读 和 迭代 器 ,可 以 递增 但 是 不 能 递减 ,而 且 只 能 读 不 能 写 。 它 适用 于 单 
通 只 读 型 算法 。 
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2) 输出 迭代 器 

输出 迭代 器 用 于 将 信息 传输 给 容器 (修改 容器 中 元 素 的 值 ) ,但 是 不 能 读 取 。 例 如 ,显示 
器 就 是 只 能 写 不 能 读 的 设备 ,可 用 输出 容器 来 表示 它 。 输 出 迭代 器 也 支持 解除 引用 和 十 十 
操作 ,也 是 单 通 的 。 所 以 ,输出 迭代 器 适用 于 单 通 只 写 型 算法 。 

3) 前 向 迭代 器 

前 向 迭代 器 只 能 使 用 十 十 操作 符 来 单 向 遍历 容器 (不 能 用 一 一 )。 与 I/O 迁 代 器 一 样 ， 
前 向 迭代 器 也 支持 解除 引用 与 十 十 操作 。 与 I/O 迭代 器 不 同 的 是 ,前 向 迭代 器 是 多 通 的 
(multi-pass) 。 即 它 总 是 以 同样 的 顺序 来 遍历 容器 ,而 且 迭 代 器 递增 后 ,仍然 可 以 通过 解除 
保存 的 迭代 器 引用 来 获得 同样 的 值 。 另 外 ,前 向 迭代 器 既 可 以 是 读 写 型 的 ,也 可 以 是 只 
读 的 。 

4) 双向 迭代 器 

可 以 用 十 十 和 一 一 操作 符 来 双向 遍历 容器 。 其 他 与 前 向 迭代 器 一 样 , 双 向 迭代 器 也 支 
持 解除 引用 ,也 是 多 通 的 并 且 是 可 读 写 或 只 读 的 。 

5) 随机 访问 迭代 器 


随机 访问 渤 代 器 可 直接 访问 容器 中 的 任意 一 个 上 和 人 从 ela 
元 素 的 双向 迭代 器 。 
可 见 , 这 5 种 迭代 器 形成 了 一 个 层次 结构 : 输 前 向 远 代 器 

入 ,输出 夫 代 器 (都 可 十 十 遍历 ,但 是 前 者 只 读 /后 者 

只 写 ) 最 基本 ; 前 向 迭代 器 可 读 写 但 只 能 十 十 遍历 ; ER 

双向 迭代 器 也 可 读 写 但 能 十 十 /一 一 双向 遍历 , 随机 和 

代 器 除了 能 够 双向 遍历 外 ,还 能 够 随机 访问 。5 种 迭代 

器 的 类 别 层次 见 图 10. 1, 其 中 每 个 下 层 和 迭代 器 支持 上 各 机 说 同和 从属 

层 迭 代 器 的 全 部 功能 。5 种 迭代 器 的 性 能 见 表 10. 4。 图 10. 1 迁 代 器 的 类 别 层次 

表 10.4 和 迭代 器 的 性 能 
功 能 输入 迭代 器 ”输出 和 迭代 器 ”前 向 迭代 器 双向 迭代 器 随机 访问 迭代 器 

读 取 ( 一 * iD 有 否 有 有 有 
写 和 人 (*i=) 否 有 有 有 有 
多 通 否 否 有 有 有 
十 十 i 和 i 十 十 有 有 有 有 有 
一 一 i 和 i 一 一 否 否 否 有 有 
i[n] 否 否 否 否 有 
i++n 和 ii 一 n 否 否 否 否 有 
i 十 =n 和 ji 一 一 n 否 否 否 否 有 
二 二 和 4 二 有 否 有 有 有 
< 和 > 否 否 否 否 有 
< 一 和 > 一 否 否 否 否 有 


注意 : 各 种 迭代 器 的 类 型 并 不 是 确定 的 ,而 只 是 一 种 概念 性 的 描述 。 不 能 用 面向 对 象 
的 语言 来 表达 迭代 器 的 种 类 , 逻 代 器 的 种 类 只 是 一 系列 的 要 求 ,而 不 是 一 种 类 型 (类 )。 在 
STL 中 ,用 概念 (concept) 一 词 来 描述 这 一 系列 要 求 。 因 此 ,有 输入 和 迭代 器 概念 和 双向 迭代 
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器 概念 ,但 是 却 没有 输入 迭代 器 类 型 和 双向 迭代 器 类 型 。 
迭代 器 在 头 文件 iterator 中 声明 。 因 为 不 同类 型 的 容器 支持 不 同 的 近代 器 ,所 以 不 必 
显 式 指定 包含 iterator 文件 也 可 以 使 用 迭代 器 。 
vector 和 deque 容器 支持 随机 访问 。list、set、multiset、multimap 容器 支持 双向 访问 。 
STL 容器 类 定义 中 用 typedef 预定 义 了 一 些 迭 代 器 ,如 表 10. 5 所 示 。 


表 10.5 预定 义 和 迭代 器 


预定 义 迭 代 器 十 十 操作 的 方向 功 能 
iterator 向 前 读 / 写 
const_iterator 向 前 读 
reverse_iterator 向 后 读 / 写 
const_reverse_iterator 向 后 读 
2. 迭代 器 的 使 用 


可 以 定义 各 种 容器 的 迭代 器 对 象 (iterator 类 型 对 象 ) , 壕 代 器 对 象 常常 被 称 为 迭代 子 或 
迭代 算 子 。 例 如 : 


vector < int >: :iterator pl; //pl 是 向 量 的 迭代 子 

list < int >: :const_iterator p2; //p2 是 整 型 双向 链表 的 迭代 子 
迭代 子 类 似 于 类 型 指针 变量 ,用 于 指向 容器 的 元 素 。 

和 迭 代 子 可 以 通过 容器 接口 获取 容器 元 素 的 迭代 。 例 如 : 


vector < int > v(10); /人 是 整 型 向 量 

Vector < int >: :iterator pl, p2; //pl 和 p2 为 int 向 量 容器 的 迭代 子 
pl=v.begin(); //pl 指向 向 量 v 的 第 一 个 元 素 
p2=v.end(); //p2 指向 向 量 v 的 表 尾 


例 10.2 正 向 ` 逆 向 输出 双向 链表 中 所 有 元 素 ,示例 STL 迭代 器 的 使 用 。 


# include < iostream > 


#include < list> // 包 含 双 向 链表 容器 头 文件 

# include < iterator > // 包 含 迭 代 器 头 文件 ,可 省 略 

using namespace std; 

int main() 

{ 

list < int > nums; //list 容器 不 支持 随机 访问 ,必须 按 顺 序 访问 容器 


nums. insert(nums. begin(),，- 100); 
nums. jinsert(nums. begin( ), 5); 
nums. insert (nums. end( ), 200); 
list < int>::const_iterator pl; // 定 义 迭 代 子 pl 用 来 正 向 指向 链表 nums 中 的 元 素 
cout <<" 正 向 输出 双向 链表 中 所 有 元 素 :"<< endl; 
for (pl = nums. begin( ) ;pl!= nums. end();pl++) // 正 向 输出 双向 链表 中 所 有 元 素 
cout << 关 p1 <<" "; 
cout << end]; 
list < int >: :reverse_iterator p2; // 定 义 迁 代 子 p2 逆向 指向 链表 nums 中 的 元 素 
p2 = nums. rbegin(); // 递 向 迭代 指向 最 后 一 个 元 素 
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cout <<" 道 向 输出 双向 链表 中 所 有 元 素 :"<< endl; 
while (p2!= nums.rend()) // 道 向 输出 双向 链表 中 所 有 元 素 
{ 
Cout << * p2 << 
++; 
4 
cout << endl; 
return 0; 


} 
程序 输出 结果 为 : 


正 向 输出 双向 链表 中 所 有 元 素 : 
5 -100 200 
逆向 输出 双向 链表 中 所 有 元 素 : 
200 -1005 


10.1.3 算法 


C++ 的 STL 提供 了 大 约 100 个 实现 算法 的 模板 函数 ,如 算法 for_each 将 为 指定 序列 中 
的 每 一 个 元 素 调 用 指定 的 函数 .stable_sort 以 用 户 所 指定 的 规则 对 序列 进行 稳定 性 排序 等 。 
这 些 是 用 于 对 容器 的 数据 施加 特定 操作 的 函数 模板 ,人 迭代 器 的 迭代 子 协同 进行 容器 数据 元 
素 的 访问 。 这 样 ,只 要 熟悉 了 STL ,许多 代码 可 以 被 大 大 地 简化 ,只 需要 通过 调用 一 两 个 算 
法 模板 ,就 可 以 完成 所 需要 的 功能 并 大 大 地 提升 效率 。 

STL 的 算法 是 通用 的 ,不 依赖 于 所 操作 容器 的 实现 细节 。 算 法 不 是 直接 使 用 容器 作为 
参数 ,而 是 使 用 迭代 器 类 型 。 这 样 只 要 容器 的 迭代 器 符合 算法 要 求 ,就 可 以 在 自己 定义 的 数 
据 结 构 上 应 用 这 些 算法 。 

STL 算法 部 分 主要 由 头 文件 <algorithm >、<numeric> 和 < functional > 组 成 。< algorithm > 
是 所 有 STL 头 文件 中 最 大 的 一 个 (尽管 它 很 好 理解 ) , 它 是 由 一 大 堆 模 板 函 数组 成 的 ,可 以 
认为 每 个 函数 在 很 大 程度 上 都 是 独立 的 ,其 中 常用 到 的 功能 范围 涉及 比较 交换、 查找 、 遍 
历 、 复 制 , 修 改 、 移 除 , 反 转 、 排 序 、 合 并 等 。< numeric > 体积 很 小 ,只 包括 几 个 在 序列 上 面 进 
行 简单 数学 运算 的 模板 函数 ,包括 加 法 和 乘法 在 序列 上 的 一 些 操作 。< functional > 中 则 定 
义 了 一 些 模板 类 ,用 以 声明 函数 对 象 。 

从 容器 的 访问 性 质 来 说 ,算法 分 为 只 读 形 式 ( 即 不 允许 修改 元 素 ) 和 改写 ( 即 可 修改 元 
素 ) 形 式 两 种 。 从 功能 上 说 ,可 以 分 为 比较 .计算 .查找 、 置 值 、 排 序 、 合 并 、 集 合 、 管 理 等 。 


1. 通用 算法 的 调用 形式 


如 同 STL 容器 是 常用 数据 结构 的 类 模板 一 样 ,STL 算法 是 用 于 对 容器 的 数据 施加 特 
定 操 作 的 函数 模板 。 

1) 一 般 形式 

例如 reverse 算法 ,该 算法 的 原型 为 : 


template < typename BidirectionalIterator > 
void reverse(BidirectionalIterator first, BidirectionalIterator last); 
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其 中 ,BidirectionalIterator 表示 双向 迭代 器 。 该 算法 的 功能 是 用 来 访问 容器 中 的 元 素 ,将 区 
间 [Lfirst,lastj] 中 的 元 素 以 相反 的 方向 放置 。 
例如 : 


reverse(v. begin(),v. end()); // 将 V 中 的 所 有 元 素 以 相反 的 方向 放置 


2) 以 函数 对 象 为 输入 参数 的 调用 形式 

在 STL 的 算法 中 ,很 多 算法 还 包含 一 种 以 函数 对 象 为 输入 参数 的 调用 形式 。 如 sort 算 
法 就 有 两 个 版 本 的 函数 模板 原型 。 

第 1 种 形式 : 


template < typename RandomAcessIterator > 
void reverse(RandomAcessIterator first, RandomAcessIterator last); 


第 2 种 形式 : 


template < typename RandomAcessIterator, class Compare > 

void reverse(RandomRcessIterator first, RandomAcessIterator last, Compare pr); 
其 中 ,RandomAcessIterator 表示 随机 访问 迭代 器 ,first 和 last 是 指定 排序 范围 的 迭代 。 

第 1 种 形式 的 算法 对 容器 的 元 素 按 升 序 排序 ,属于 一 般 形式 。 第 2 种 形式 的 算法 由 函 
数 对 象 pr 调用 函数 指定 序列 关系 ,Compare 表示 返回 逻辑 值 的 二 元 函数 ,通过 sort() 函 数 
获取 排序 时 正在 比较 的 两 个 元 素 ,并 返回 比较 的 关系 值 。 例 如 , 若 对 表 中 任意 元 素 序列 号 有 
i<j 时 , 则 元 素 a[i] 太 a[j] 表 示 按 升序 排序 ; a[i] 宇 a[Lj] 表 示 按 降序 排列 。 这 样 一 来 , 即 
可 以 升序 ,也 可 以 降序 ,或 者 其 他 特定 的 规则 ,程序 设计 的 灵活 性 更 大 。 

例如 : 

sort(v. begin(),v. end()); // 对 向 量 V 的 全 部 元 素 按 升序 排序 


sort(v. begin( ),v. end(), inorder); 
// 通 过 inorder 调用 相应 的 测试 函数 , 可 对 向 量 V 进行 相应 的 排序 


2. 通用 算法 应 用 


对 于 STL 算法 ,关键 不 在 于 了 解 算法 是 如 何 设计 的 ,而 在 于 在 应 用 程序 中 如 何 使 用 这 
些 算法 。 下 面 以 reverse 算法 与 sort 算法 的 使 用 为 例 ,演示 算法 的 应 用 。 
例 10.3 reverse 算法 与 sort 算法 的 应 用 。 


# include < iostream> 

# include < vector > 

# include < algorithm > 

using namespace std; 

bool inorder(int, int); 

int main() 

{ 

Vector < int > nums; 

nums. insert(nums. begin( ), ~ 100); 
nums. insert(nums. begin( ), 5); 
nums. insert (nunms. end( ), 200); 
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cout <<" 向 量 的 初始 顺序 为 :"<< endl; 
vector < int >: :iterator pl; 
for (pl = nums. begin();pl!= nums. end();pl++) 
Cout <<* pl <<" "; 
cout << endl; 
reverse(nums. begin( ), nunms. end( ) ); // 调 用 倒序 算法 
cout <<" 向 量 倒置 后 的 顺序 为 :"<< endl; 
for (int i= 0;i<nunms. size();i+t+) 
cout << nums[ i]<<' 
cout << endl; 
sort (nums. begin( ), nums. end( )); // 调 用 第 1 种 形式 排序 算法 
cout <<" 使 用 第 1 种 形式 排序 后 ,向 量 的 顺序 为 :"<< endl; 


for (i=0;i<nunms.size();it+) 


cout << nums[ i]<<”" 
cout << endl; 
sort(nums. begin( ), nunms. end( ), inorder); // 调 用 第 2 种 形式 排序 算法 
cout <<" 使 用 第 2 种 形式 排序 后 ,向量 的 顺序 为 :"<< endl; 
for (i=0;i<nums. size();i+t+) 

cout << nums[i]<<" "; 
cout << endl; 
return 0; 


} 


bool inorder(int a, int b) {return a> b;}; 


程序 输出 结果 为 ， 


向 量 的 初始 顺序 为 : 

5 -100 200 

向 量 倒置 后 的 顺序 为 : 

200 -100 5 

使 用 第 1 种 形式 排序 后 ,向 量 的 顺序 为 : 
—100 5 200 

使 用 第 2 种 形式 排序 后 ,向 量 的 顺序 为 : 
200 5 -100 


(i0,2 STL 应 用 实例 


10.2.1 双向 链表 操作 的 STL 实现 


链表 是 经 常用 到 的 数据 结构 ,用 STL 编写 一 个 对 双向 链表 进行 基本 操作 的 程序 。 要 求 
能 从 两 端 开始 插入 、 删 除 和 输出 结 点 。 
例 10.4 通过 STL 对 双向 链表 进行 基本 操作 。 


# include < iostream > 


#include <list> // 包 含 双 向 链表 容器 头 文件 
# include < iterator > // 包 含 迭 代 器 头 文件 ,可 省 略 
# include <algorithm> //STL 算法 


using namespace std; 
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int main() 
{ 
list< int > Linkist; 
int value = 0, select = 0; 
dof 
cout << endl 
<<" 双向 链表 菜单 "<< endl 
<<"1. 在 链表 首部 插入 一 个 结 点 "<< endl 
<<"2. 在 链表 尾部 插入 一 个 结 点 "<< endl 
<<"3. 从 链表 首部 删除 一 个 结 点 "<< endl 
<<"4. 从 链表 尾部 删除 一 个 结 点 "<< endl 
<<"5. 从 链表 首部 开始 输出 结 点 内 容 "<c endl 
<<"6. 从 链表 尾部 开始 输出 结 点 内 容 "<c endl 
<<"0. 退出 "<< endl 
<<" 输 出 选择 :"; 
cin >> select; 
switch (select) 


{ 


case 1: 
本 
cout <<" 输 入 结 点 数据 :"; 
cin>> value; 
Linkist. insert(Linkist. begin(), value); 
cout <<" 结 点 "<< value <<" 成 功 搬入 。"<< endl; 
break; 
} 
Case 2: 
{ 
cout <<" 输 入 结 点 数据 :"; 
cin>> value; 
Linkist. insert (Linkist. end(), value); 
cout <<" 结 点 "<< value <<" 成 功 插入 。"<< endl; 
break; 
} 
Case 3: 
{ 
if (Linkist. begin() == Linkist. end()) 
cout << endl <<" 没 有 链表 , 不 能 进行 删除 。"; 
else 
{ 
Linkist. erase(Linkist. begin()); 
cout << endl <<" 结 点 删除 成 功 ."<< end]l; 
} 
break., 
} 
case 4: 
{ 


if (Linkist. begin() == Linkist. end()) 
cout << endl <<" 没有 链表 ,不 能 进行 删除 。; 


else 


{ 
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Linkist. erase(Linkist. end()); 
cout << endl <<" 结 点 删除 成 功 。"<< endl; 
} 


break; 
} 
Case 5: 
{ 
list < int >: :const_iterator pl; //pl 是 整 型 双向 链表 的 迭代 子 
if (Linkist. begin() == Linkist. end()) 
cout << endl <<" 没 有 链表 ,不 能 进行 删除 . "; 
else 
{ 
cout << endl <<" 从 首部 开始 输出 链表 :"<< endl; 
for (pl = Linkist. begin();pl!= Linkist.end();p1++) 
cout <<* pl <<" "; 
cout << end]l; 
break; 
} 
Case 6: 
{ 


list < int >: :reverse_iterator p2; //p2 是 整 型 双向 链表 的 迭代 子 
if (Linkist. rbegin() == Linkist. rend()) 
cout << end]l <<" 没 有 链表 , 不 能 进行 删除 。"; 
else 
cout << endl <<" 从 尾部 开始 输出 链表 :"<< endl; 
p2 = Linkist. rbegin( ); 
while (p2!= Linkist. rend( )) 
{ 
cout <<* p2 <<" "; 
Pp2++; 
l 
cout << endl; 
L 
break; 
} 
} 
}while (select!= 0); 
return 0; 


} 


10.2.2 STL 测试 程序 


为 了 测试 10. 1 节 中 介绍 的 知识 , 现 编写 一 个 测试 程序 ,如 例 10.5 所 示 。 
例 10.5 ”stl 测试 程序 。 
# include < iostream > 


# include < vector > 
#include < stack> 
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# include < iterator > 
# include <algorithm> 
using namespace std; 


int main() 
{ 
cout <<" 以 下 程序 测试 vector 的 用 法 …… "<< endl; 
vector < int > intList; // 声 明 向 量 容器 ,类 型 为 int 
dt 
intList. push_back(13); // 向 向 量 容器 中 插入 4 个 数字 13,75, 28, 35 


intList. push_back(75); 

intList. push_back(28); 

intList. push back(35); 

cout <<"Line 5: List Elements:"<< endl; 

for(i=0; i<4; i++) // 输 出 intList 中 的 元 素 
cout << intList[i]<<" "; 

cout << endl; 

for(i=0; i<4; it+) // 将 向 量 中 的 元 素 值 乘 以 2 
intList[i] * = 2; 

cout <<"Lint 10: List Elements:"<< endl; 

for(i=0; i<4; i++) 

cout << intList[i]<<" "; 

cout << endl; 

vector < int >: :iterator listIt; // 声 明 listIt 为 向 量 迭 代 器 
cout <<"Line 15: List Elements:"<< endl; 

for(listIt= intList. begin(); listIt!= intList.end(); ++listIt) 

// 使 用 迭代 器 输出 

cout <<* listIt <<" "; 

cout << endl; 


listIt = intList. begin(); // 重 新 定向 迭代 器 
++1istIt; // 和 迭代 器 前 进 两 位 
++1istIt; 

intList. insert(listIt, 88); // 在 第 二 的 位 置 上 插入 88 


cout <<"Line 23: List Elements:"<< endl; 
for(listIt = intList. begin(); listIt!= intList. end(); ++listIt) // 输 出 
四 


cout <<* listIt <<" "; 
cout << endl; 


cout <<" 以 下 程序 测试 stack 的 用 法 …… "<< endl; 

stack < int > intStack; // 定 义 栈 对 象 , 类 型 为 int 
intStack. push(16); // 向 栈 中 插入 数据 16,8,20,3 
intStack. push(8); 

intStack. push(20); 

intStack. push(3); 

cout <<"Line 6: The top element of intStack: " 

<< intStack. top( )<< end1; // 输 出 栈 顶 元 素 

intStack. pop( ); // 删 除 栈 顶 元 素 

cout <<"Line 8: After the pop operation," 

<<"the top element of intStack: " 

<< intStack. top( )<< endl; 

cout <<"Line 9: intStack elements: "; 


while(! intStack. empty( )) // 输 出 栈 中 所 有 元 素 
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{ 

cout << intStack. top( )<<" "; 
intStack. pop( ); 

} 


cout << end] ; 


cout <<" 以 下 程序 测试 copy( ) 函 数 的 用 法 …… "<< endl; 


int intarray[] = {5,6,8,3,40,36,98,29,75}; // 定 义 数组 

vector < int > vecList(9); // 定 义 向 量 

ostream iterator < int > screen(cout," "); // 定 义 ostream 迄 代 器 
cout <<"Line 4: intArray: "; 

copy( intArray, intArray +9, screen); // 输 出 数组 内 容 


cout << endl; 

Copy( intArray, intArray +9, vecList. begin()); // 将 数组 内 容 拷贝 到 向 量 中 
cout <<"Line 8: vecList: "; 

copy(vecList. begin(), vecList. end(), screen); // 输 出 向 量 内 容 

cout << endl; 

copy(intArray + 1, intArray + 9, intArray); // 将 intarray 中 的 元 素 向 前 移动 一 位 
cout <<"Line 12: After shifting the elements one" 

<<"position to the left, "<< endl 

<<" intArray: "; 

copy( intArray, intArray + 9, screen); // 输 出 intarray 中 的 所 有 元 素 
cout << endl; 

copy(vecList. rbegin() + 2，vecList. rend(), vecList. rbegin()); 

// 将 vecList 中 的 元 素 向 后 移动 两 位 

cout <<"Line 16: After shifting the elements down” 

<<" by two position, "<< endl 

<<" vecList: "; 

copy(vecList. begin(), vecList.end(), screen); // 输 出 vecList 中 的 所 有 元 素 
cout << endl; 


cout <<" 以 下 程序 测试 fi11() 和 fill_n() 函 数 的 用 法 … "<< endl; 


vector < int > vecList1(8); // 声 明 向 量 容 器 
ostream iterator < int > screenl(cout," "); // 声 明 ostream 迭代 器 
fill(vecList1. begin( ), vecList1. end(),2); // 用 2 填充 vecList1 


cout <<"Line 4: After filling vecListl with 2's: "; 
copy(vecList1. begin( ), vecList1.end()，screen1); // 输 出 

cout << endl; 

fill n(vecListl. begin(),3,5); // 将 vecListl 中 的 前 三 个 元 素 用 5 填充 
cout <<"Line 8: After filling the first three" 

<<"elements with 5's: " 

<< endl <<" "; 

copy(vecList1. begin(), vecList1.end()，screen1); // 再 次 输出 

cout << endl; 


cout <<" 以 下 程序 测试 find( ) 和 find_if( ) 函 数 的 用 法 …… "<< endl; 
char cList[10] = {'a', ‘i','C','d', 'e', 'f','0', 'H', "a, j'}; 
vector < char > charList(cList, cList+10); 

vector < char >: :iterator position; 


/* 以 下 语句 在 charList 中 查找 'd' 第 一 次 出 现 的 位 置 ,并 且 返 回 一 个 迁 代 器 ,该 迁 代 器 存储 在 


position 中 ,因为 'd' 是 charList 中 的 第 4 个 字符 , 它 的 位 置 是 3, 因 此 position 指向 charList 中 位 置 
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3 上 的 元 素 */ 

position = find(charList. begin(), charList. end(), 'd'); 

/* 以 下 语句 使 用 函数 find_if() 查 找 charList 中 的 第 一 个 大 写字 符 ( 注 意 ,来 自 头 文件 cctype 
的 函数 isupper() 作 为 第 三 个 参数 传递 给 函数 find_ 证 ()),charList 中 的 第 一 个 大 写字 符 是 第 三 个 
元 素 , 因 此 ,这 条 语句 执行 后 , position 指向 charList 的 第 三 个 元 素 * / 

position = find if(charList.begin(), charList.end(), isupper); 


cout <<" 以 下 程序 测试 remove( ) 和 replace( ) 函数 的 用 法 …… "<< endl; 
char cList1[10] = {'A', 'a', 'R 'B', 'A', 'C', 'D', 'e', 'F', 'A'}; // 定 义 数 组 


vector < char > charListl(cListl,cListl + 10); // 定 义 向 量 容器 ,初始 化 为 数组 的 值 
vector < char > charList2(cList, cList + 10); // 定 义 向 量 容器 ,初始 化 为 数组 的 值 
vector < char >: : iterator lastElem; // 声 明 向 量 迭 代 器 

ostream iterator < char > screen2(cout," "); // 声 明 ostream 欠 代 器 


cout <<"Line 6: Character listl: "; 

copy(charList1. begin(), charList1.end(), screen2); // 输 出 charListl 
cout << endl; 

/* 删除 charList1 中 所 有 的 'A', 返回 新 范围 中 最 后 一 个 元 素 的 字符 位 置 * / 
lastElem = remove(charListl.begin(),charListl.end(),'A'); 

cout <<"Line 10: Character listl after removed A: "; 

copy(charList1. begin(), lastElem, screen2); // 重 新 输出 charList1l 
cout << endl; 

cout <<"Line 13: Character list2: "; 

copy(charList2. begin(), charList2.end(), screen2); ”// 输 出 charList2 
cout << endl; 

replace(charList2. begin(), charList2. end(), 'A', '2'); 

// 将 charList2 中 所 有 的 'A' 替 换 为 'zZ' 

cout <<"Line 17: Character list2 after replaced A with 2: "; 

copy(charList2. begin(), charList2.end(), screen2); // 重 新 输出 charList2 
cout << endl; 


cout <<" 以 下 程序 测试 search( ) ,sort() 和 binary_search( ) 函数 的 用 法 …… "<< endl; 
int intList1[15] = {12,34,56,34,34,78,38,43,12,25,34,56,62,5,49}; 
// 定 义 数组 intList1 

vector < int > vecList2(intListl, intListl + 15); 


// 创 建 向 量 ,初始 化 为 数组 intListl 的 值 


int list[2] = {34,56}; // 定 义 数组 list 
vector < int >: :iterator location; // 定 义 向 量 容器 和 迭代 器 
ostream iterator < int > screen3(cout," "); // 定 义 ostream 迭代 器 
cout <<"Line 6: vecList2: "; 

copy(vecList2. begin(), vecList2.end(), screen3); // 输 出 vecList2 的 值 


cout << endl; 

cout <<"Line 9: list: "; 

copy(list, list+2, screen3); // 输 出 list 的 值 
cout << endl; 

// 在 vecList2 中 查找 list 中 元 素 第 一 次 出 现 的 位 置 ,并 返回 出 现 的 位 置 
location = search(vecList2.begin(),vecList2.end(), list, list + 2); 
if(location != vecList2. end()) 

cout <<"Line 13: list found in vecList2. The " 

<<"first occurence of \n list in vecList2 " 

<<"is at position: " 


<<(location - vecList2. begin())<< endl; // 输 出 搜索 出 来 的 位 置 
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else 


cout <<"Line 15: list is not in vecList2."<< endl; 


sort(vecList2. begin( ),vecList2.end()); // 排 序 vecList2 
cout <<"Line 17: vecList2 after sorted: "<< endl <<" "; 

copy(vecList2. begin(), vecList2.end(), screen3); // 输 出 vecList2 
cout << endl; 


// 在 vecList2 中 查找 43, 并 返回 找到 的 位 置 

bool found = binary search(vecList2.begin(),vecList2.end(),43); 
if(found) 

cout <<"Line 22: 43 found in vecList2 "<< endl; 

else 

cout <<"Line 23: 43 not in vecList2"<< endl; 


return 0; 


回 题 10 


1. 使 用 STL 的 set 容器 , 重 载 二 元 操作 符 十 、 一 和 * 来 定义 集合 的 并 ,交差 运算 。 
2. 使 用 STL 的 map 容器 ,实现 统计 功能 。 如 : 读 入 一 组 数据 (文具 ,数量 ), 用 (stationery， 
amount) 表 示 ,统计 各 种 文具 的 总 数 。 
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1. 用 STL 编写 一 个 对 用 链 式 存储 结构 表示 的 一 元 多 项 式 进行 四 则 运算 操作 的 程序 。 
2. 用 STL 编写 一 个 对 用 三 元 组 存储 结构 表示 的 稀疏 矩阵 进行 四 则 运算 操作 的 程序 。 


| 
[2] 
[3] 
[4] 
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